Esistono strumenti più robusti di Automator per estrarre testo da più PDF?

3

Esiste un'azione in Automator che ti consente di " Estrai testo PDF " a livello di programmazione, ma non riesce quando viene alimentata una quantità moderata di file (da 25 a 100). Peggio ancora, fallisce senza registrare nulla di utile tranne che per un messaggio che "Automator si chiude inaspettatamente".

Qualcuno sa di un comando equivalente per fare ciò in Applescript? Sto cercando strumenti in cui ho più controllo su cose come la registrazione e la gestione degli errori, quindi posso essere più efficiente nell'elaborare i file PDF in un formato di testo.

    
posta user141146 30.04.2013 - 15:01
fonte

1 risposta

2

Non so come si confronta con altre opzioni, ma potresti usare pdfotext. Può essere installato con brew install xpdf .

do shell script "/usr/local/bin/pdftotext /usr/share/doc/bash/bash.pdf -" without altering line endings

Calibre viene fornito con alcune utilità della riga di comando:

/Applications/calibre.app/Contents/MacOS/ebook-convert /usr/share/doc/bash/bash.pdf /tmp/output.txt

Domande correlate:

risposta data 30.04.2013 - 15:40
fonte

Leggi altre domande sui tag