Update PDF text parser classes. Remove SlateParser and substitute with a PDFMiner based parser.

2015-07-31 02:09:48 -04:00
parent 1361ea9b42
commit 8382df91a6
7 changed files with 254 additions and 36 deletions
--- a/mayan/apps/ocr/settings.py
+++ b/mayan/apps/ocr/settings.py
@@ -9,10 +9,6 @@ setting_tesseract_path = namespace.add_setting(
    global_name='OCR_TESSERACT_PATH', default='/usr/bin/tesseract',
    help_text=_('File path to tesseract program.'), is_path=True
 )
-setting_unpaper_path = namespace.add_setting(
-    global_name='OCR_UNPAPER_PATH', default='/usr/bin/unpaper',
-    help_text=_('File path to unpaper program.'), is_path=True
-)
 setting_pdftotext_path = namespace.add_setting(
    global_name='OCR_PDFTOTEXT_PATH', default='/usr/bin/pdftotext',
    help_text=_(