Qualcuno ha un suggerimento per digitalizzare + OCR'in un corpus stampato con immagini?
Ho 1200 pagine di testo cosparse di fotografie essenziali. Supponendo che io abbia delle scansioni perfette delle pagine, quali sono le mie opzioni per preservare il layout del testo originale e permettermi di dare questo ad un programma?