Ho intenzione di ottenere un ufficio senza carta e per questo, ho bisogno di un buon pezzo di OCR per OS X?
Ho letto un blogpost di Marco Arment su alcuni programmi . Ci sono dei fattibili che mi permettano di scrivere cose?
OCRKit ha sia il supporto per AppleScript sia una CLI. Dalla loro pagina di aiuto :
AppleScript
You can also script OCRKit to integrate it into your specific workflow. For example process incoming files, via shared folder, from MFP copy machine, etc. and simply tell OCRKit to open and thus process is via AppleScript:
tell application "OCRKit" -- the wonders of AppleScript POSIX path handling, ... open "Users:admin:Desktop:orderform.pdf" open POSIX path of "/Users/Admin/Desktop/orderform.pdf" end tell
Command line
Since OCRKit version 2.5 direct command line scripting is supported. This greatly simplifies the use of OCRKit in batch processing, allows to set more options and is also more robust and cross-platform than AppleSCript.
OCRKit.app/Contents/MacOS/OCRKit \ --lang en | de | fr | es | ... \ --format pdf | html | rtf | text \ --no-progress \ --output out-file in-file
Since OCRKit version 16.9 additional command line options are supported:
-r, --recursive directory
Scan directory recursively for new files. Skips files from OCRKit, with text layer or vector graphics.
--pattern "regex"
Pattern used to match filenames during recursive scans. Defaults to
%.pdf$
, recommendation for TIFF is%.tiff?$
--log file
Write log file information and statistics during recursive scan to file.
--password secret
Use secret password to decrypt PDF files during batch processing.
--test-run [ fast ]
Only run test batch processing in test mode to test PDF files or to obtain page count to estimate total processing time. "fast" will only check the first page of each file, instead of going thru all pages for image and vector analyzation.
--tag name
Use extended attribute name to tag the processing state of files during batch processing.
macos:OCRKit (%s)
will use native macOS Finder tags instead, or simplymacos:OCRKit
not including the state attribute. The order of the state attribute are:started
,analyzed
,processed
, and can also beencrypted
.
Readiris per Mac. Ce l'ho, ma non ho L'ho usato per molto tempo, quindi non ricordo esattamente quanto fosse bello. Penso che non abbia fatto molto bene i primi documenti, ma impara.
Oh, e non sono sicuro della scriptability. Lo controllerò
Sembra che Readiris abbia un dizionario di scripting, ed è anche abbastanza buono.
ABBYY FineReader Pro per Mac funziona bene con l'OCR ed è programmabile tramite script. Dalla loro pagina blurb :
Process Batches of Documents and Automate Conversion Tasks
Achieve new levels of productivity and enjoy greater flexibility when converting documents with support for Automator actions and AppleScript commands.
Supporta sia Applescript che Automator. Non avevo ancora provato ad automatizzarlo in precedenza, ma dopo averlo esaminato, ho alcuni piani per fare alcune cose di base. Questo è davvero il motivo per cui sto ritardatamente "rispondendo" a questa domanda.
Leggi altre domande sui tag software-recommendation script ocr scanning