Pianificazione della conversione da PDF a JPG, annotazione dell'immagine, riconversione in PDF

2

Ho una funzione in cui i libri delle risposte all'esame scansionato devono essere annotati e contrassegnati digitalmente.

La porzione di scansione del lavoro è con un altro fornitore che si rifiuta di eseguire la scansione in qualsiasi formato diverso da PDF in quanto è più sicuro e inalterabile.

Ho bisogno di sviluppare un codice che possa mostrare le 20 pagine dispari nel PDF sullo schermo usando un browser web, annotarlo con pochi simboli ✓ e ✗, aggiungere segni, scrivere commenti, disegnare linee, ecc. e salvare il PDF con questo.

Il mio approccio attuale:

  1. Usa ImageMagick per estrarre singole pagine da PDF come immagini
  2. Carica immagini con tag <img> nel browser
  3. Utilizza jQuery per creare un menu di scelta rapida per creare annotazioni
  4. Salva la parte sinistra, superiore, larghezza, altezza, testo dell'elemento <div> in un database in relazione a ciascuna immagine del PDF

Ogni volta che qualcuno richiede un PDF annotato, ho intenzione di servirlo estraendo nuovamente il PDF in immagini, recuperando e sostituendo gli elementi <div> nel posto giusto e usando FPDF per generare il PDF.

Ho già fatto tutto questo e funziona perfettamente.

Mi chiedo se questo sia il modo giusto per farlo comunque? Sembra un po 'indietro, ma non riesco davvero a pensare a nessun altro modo.

Aiutaci a convalidare il metodo o suggerire qualcosa di meglio.

    
posta Abhilash 31.05.2016 - 10:58
fonte

2 risposte

1

Bene, guardalo in questo modo: la tua scansione di input è già un'immagine raster (il fatto che tali grafici raster siano incorporati in PDF è per lo più irrilevante), quindi un processo basato su immagini raster è tutto ciò che puoi aspettarti. L'utilizzo dell'OCR potrebbe essere un'opzione, ma probabilmente complicherebbe il processo senza alcun reale vantaggio e un'ulteriore fonte di potenziali errori.

Se vuoi migliorare il processo, devi iniziare un passo prima: i libri delle risposte all'esame potrebbero essere moduli elettronici PDF o HTML fin dall'inizio, con campi modulo per le risposte e le annotazioni. Quindi potresti abbreviare l'intero processo di annotazione e rendere l'implementazione molto più semplice. Ma capisco che per molti casi del mondo reale questo tipo di approccio non è fattibile: ad esempio, gli esami devono essere fatti a mano su carta per motivi legali o perché disporre di un'infrastruttura di rilevamento completamente elettronica è fuori questione. Se il tuo appartiene a questa categoria, penso che la tua soluzione sia perfettamente ragionevole.

    
risposta data 31.05.2016 - 14:01
fonte
1

Adobe Acrobat (e anche altri software PDF) ha molte funzioni di annotazione. Quello che raccomanderei è il "timbro di gomma". Si potrebbe avere una X rossa e un segno di spunta verde definito come francobolli, ad esempio. È quindi possibile crearli sull'immagine PDF desiderata e quindi salvare nuovamente il PDF.

    
risposta data 31.05.2016 - 19:12
fonte

Leggi altre domande sui tag