Added remaining functionality to document indexing (filesystem rebuild, better warning reporting)

2011-05-20 00:34:31 -04:00
parent 7f59c16316
commit a02c5c7c8d
9 changed files with 108 additions and 173 deletions
--- a/apps/document_indexing/api.py
+++ b/apps/document_indexing/api.py
@@ -12,9 +12,10 @@ from document_indexing.models import Index, IndexInstance, \
 from document_indexing.conf.settings import AVAILABLE_INDEXING_FUNCTIONS
 from document_indexing.conf.settings import MAX_SUFFIX_COUNT
 from document_indexing.filesystem import fs_create_index_directory, \
-    fs_create_document_link, fs_delete_document_link
-
+    fs_create_document_link, fs_delete_document_link, \
+    fs_delete_index_directory, fs_delete_directory_recusive
 from document_indexing.conf.settings import SLUGIFY_PATHS
+from document_indexing.os_agnostic import assemble_document_filename

 if SLUGIFY_PATHS == False:
    # Do not slugify path or filenames and extensions
@@ -32,7 +33,6 @@ def update_indexes(document):
    """
    Update or create all the index instances related to a document
    """
-    print 'update_indexes'
    warnings = []

    eval_dict = {}
@@ -50,20 +50,21 @@ def update_indexes(document):
 def delete_indexes(document):
    """
    Delete all the index instances related to a document
-    """    
+    """
    warnings = []
-    
+
    for index_instance in document.indexinstance_set.all():
-        _remove_document_from_index_instance(document, index_instance)
-            
+        index_warnings = _remove_document_from_index_instance(document, index_instance)
+        warnings.extend(index_warnings)
+
    return warnings


 def get_instance_link(index_instance=None, text=None, simple=False):
    """
    Return an HTML anchor to an index instance
-    """    
-    
+    """
+
    if simple:
        # Just display the instance's value or overrided text, no
        # HTML anchor
@@ -81,18 +82,18 @@ def get_instance_link(index_instance=None, text=None, simple=False):
            'url': reverse('index_instance_list'),
            'value': ugettext(u'root')
        }
-        

-def get_breadcrumbs(index_instance, simple=False, single_link=False):
+
+def get_breadcrumbs(index_instance, simple=False, single_link=False, include_count=False):
    """
    Return a joined string of HTML anchors to every index instance's
    parent from the root of the tree to the index instance
-    """    
+    """
    result = []
    if single_link:
        # Return the entire breadcrumb path as a single HTML anchor
        simple = True
-    
+
    result.append(get_instance_link(simple=simple))

    for instance in index_instance.get_ancestors():
@@ -100,31 +101,42 @@ def get_breadcrumbs(index_instance, simple=False, single_link=False):

    result.append(get_instance_link(index_instance, simple=simple))

+    output = []
+
+    if include_count:
+        output.append(u'(%d)' % index_instance.documents.count())
+
    if single_link:
        # Return the entire breadcrumb path as a single HTML anchor
-        return mark_safe(get_instance_link(index_instance=index_instance, text=(u' / '.join(result))))
+        output.insert(0, get_instance_link(index_instance=index_instance, text=(u' / '.join(result))))
+        return mark_safe(u' '.join(output))
    else:
-        return mark_safe(u' / '.join(result))
+        output.insert(0, u' / '.join(result))
+        return mark_safe(u' '.join(output))


 def do_rebuild_all_indexes():
+    fs_delete_directory_recusive()
    IndexInstance.objects.all().delete()
    DocumentRenameCount.objects.all().delete()
    for document in Document.objects.all():
        update_indexes(document)
-    
-    
+
+    return []  # Warnings - None
+
+
 # Internal functions
-def find_lowest_available_suffix(suffix_list):
-    print 'suffix_list', suffix_list
-    suffix = 0
-    
-    while suffix in suffix_list:
-        suffix += 1
-        if suffix > MAX_SUFFIX_COUNT:
-            raise MaxSuffixCountReached(ugettext(u'Maximum suffix (%s) count reached.') % MAX_SUFFIX_COUNT)
-    else:
-        return suffix
+def find_lowest_available_suffix(index_instance, document):
+    index_instance_documents = DocumentRenameCount.objects.filter(index_instance=index_instance).filter(document__file_extension=document.file_extension)
+    files_list = []
+    for index_instance_document in index_instance_documents:
+        files_list.append(assemble_document_filename(index_instance_document.document, index_instance_document.suffix))
+
+    for suffix in xrange(MAX_SUFFIX_COUNT):
+        if assemble_document_filename(document, suffix) not in files_list:
+            return suffix
+
+    raise MaxSuffixCountReached(ugettext(u'Maximum suffix (%s) count reached.') % MAX_SUFFIX_COUNT)


 def _evaluate_index(eval_dict, document, node, parent_index_instance=None):
@@ -132,50 +144,47 @@ def _evaluate_index(eval_dict, document, node, parent_index_instance=None):
    Evaluate an enabled index expression and update or create all the
    related index instances also recursively calling itself to evaluate
    all the index's children
-    """    
+    """
    warnings = []
    if node.enabled:
        try:
            result = eval(node.expression, eval_dict, AVAILABLE_INDEXING_FUNCTIONS)
-            index_instance, created = IndexInstance.objects.get_or_create(index=node, value=result, parent=parent_index_instance)
-            if created:
+            if result:
+                index_instance, created = IndexInstance.objects.get_or_create(index=node, value=result, parent=parent_index_instance)
+                #if created:
                fs_create_index_directory(index_instance)
-            if node.link_documents and document not in index_instance.documents.all():
-                #suffix_list = index_instance.documents.filter(file_filename=document.file_filename).filter(file_extension=document.file_extension).values_list('suffix', flat=True)
-                suffix_list = DocumentRenameCount.objects.filter(document__file_filename=document.file_filename).filter(document__file_extension=document.file_extension).filter(index_instance=index_instance).values_list('suffix', flat=True)
-                suffix = find_lowest_available_suffix(suffix_list)
-                print 'lower suffix: %s' % suffix
-                document_count = DocumentRenameCount(
-                    index_instance=index_instance,
-                    document=document,
-                    suffix=suffix
-                )
-                document_count.save()
+                if node.link_documents:
+                    suffix = find_lowest_available_suffix(index_instance, document)
+                    document_count = DocumentRenameCount(
+                        index_instance=index_instance,
+                        document=document,
+                        suffix=suffix
+                    )
+                    document_count.save()

-                fs_create_document_link(index_instance, document, suffix)
-                index_instance.documents.add(document)
+                    fs_create_document_link(index_instance, document, suffix)
+                    index_instance.documents.add(document)

-            for children in node.get_children():
-                children_warnings = _evaluate_index(
-                    eval_dict, document, children, index_instance
-                )
-                warnings.extend(children_warnings)
+                for children in node.get_children():
+                    children_warnings = _evaluate_index(
+                        eval_dict, document, children, index_instance
+                    )
+                    warnings.extend(children_warnings)

        except (NameError, AttributeError), exc:
            warnings.append(_(u'Error in document indexing update expression: %(expression)s; %(exception)s') % {
                'expression': node.expression, 'exception': exc})
-
        except Exception, exc:
            warnings.append(_(u'Error updating document index, expression: %(expression)s; %(exception)s') % {
                'expression': node.expression, 'exception': exc})
-                
+
    return warnings


 def _remove_document_from_index_instance(document, index_instance):
    """
    Delete a documents reference from an index instance and call itself
-    recusively deleting documents and empty index instances up to the 
+    recusively deleting documents and empty index instances up to the
    root of the tree
    """
    warnings = []
@@ -188,14 +197,15 @@ def _remove_document_from_index_instance(document, index_instance):
            # if there are no more documents and no children, delete
            # node and check parent for the same conditions
            parent = index_instance.parent
+            fs_delete_index_directory(index_instance)
            index_instance.delete()
            parent_warnings = _remove_document_from_index_instance(
                document, parent
            )
            warnings.extend(parent_warnings)
-            
+    except DocumentRenameCount.DoesNotExist:
+        return warnings
    except Exception, exc:
-        print '_remove_document_from_index_instance exception: %s' % exc
        warnings.append(_(u'Unable to delete document indexing node; %s') % exc)

    return warnings