Che software OCR scrivibile esiste su OSX per un ufficio senza carta

4

Ho intenzione di ottenere un ufficio senza carta e per questo, ho bisogno di un buon pezzo di OCR per OS X?

Ho letto un blogpost di Marco Arment su alcuni programmi . Ci sono dei fattibili che mi permettano di scrivere cose?

    
posta kventil 08.09.2011 - 20:32
fonte

3 risposte

2

OCRKit ha sia il supporto per AppleScript sia una CLI. Dalla loro pagina di aiuto :

AppleScript

You can also script OCRKit to integrate it into your specific workflow. For example process incoming files, via shared folder, from MFP copy machine, etc. and simply tell OCRKit to open and thus process is via AppleScript:

tell application "OCRKit"
   -- the wonders of AppleScript POSIX path handling, ...
   open "Users:admin:Desktop:orderform.pdf"
   open POSIX path of "/Users/Admin/Desktop/orderform.pdf"
end tell 

Command line

Since OCRKit version 2.5 direct command line scripting is supported. This greatly simplifies the use of OCRKit in batch processing, allows to set more options and is also more robust and cross-platform than AppleSCript.

OCRKit.app/Contents/MacOS/OCRKit \ 
    --lang en | de | fr | es | ... \
    --format pdf | html | rtf | text \
    --no-progress \
    --output out-file in-file

Since OCRKit version 16.9 additional command line options are supported:

-r, --recursive directory

Scan directory recursively for new files. Skips files from OCRKit, with text layer or vector graphics.

     

--pattern "regex"

     

Pattern used to match filenames during recursive scans. Defaults to %.pdf$, recommendation for TIFF is %.tiff?$

     

--log file

     

Write log file information and statistics during recursive scan to file.

     

--password secret

     

Use secret password to decrypt PDF files during batch processing.

     

--test-run [ fast ]

     

Only run test batch processing in test mode to test PDF files or to obtain page count to estimate total processing time. "fast" will only check the first page of each file, instead of going thru all pages for image and vector analyzation.

     

--tag name

     

Use extended attribute name to tag the processing state of files during batch processing. macos:OCRKit (%s) will use native macOS Finder tags instead, or simply macos:OCRKit not including the state attribute. The order of the state attribute are: started, analyzed, processed, and can also be encrypted.

    
risposta data 14.03.2018 - 00:18
fonte
1

Readiris per Mac. Ce l'ho, ma non ho L'ho usato per molto tempo, quindi non ricordo esattamente quanto fosse bello. Penso che non abbia fatto molto bene i primi documenti, ma impara.

Oh, e non sono sicuro della scriptability. Lo controllerò

Sembra che Readiris abbia un dizionario di scripting, ed è anche abbastanza buono.

    
risposta data 08.09.2011 - 23:08
fonte
0

ABBYY FineReader Pro per Mac funziona bene con l'OCR ed è programmabile tramite script. Dalla loro pagina blurb :

Process Batches of Documents and Automate Conversion Tasks

Achieve new levels of productivity and enjoy greater flexibility when converting documents with support for Automator actions and AppleScript commands.

Supporta sia Applescript che Automator. Non avevo ancora provato ad automatizzarlo in precedenza, ma dopo averlo esaminato, ho alcuni piani per fare alcune cose di base. Questo è davvero il motivo per cui sto ritardatamente "rispondendo" a questa domanda.

    
risposta data 13.03.2017 - 12:23
fonte

Leggi altre domande sui tag