Come posso elaborare / leggere i segni di spunta su un modulo cartaceo?

7

Vorrei elaborare un gran numero di moduli di carta scansionati (GUI o riga di comando). Mi interessa solo leggere le caselle di controllo (personalizzate). Il modulo ha il seguente aspetto:

  • ogni riga ha 6 caselle a forma di cerchio (una è contrassegnata)
  • form ha più di 45 linee

Dopo l'elaborazione, vorrei avere il valore verificato (1 ... 6) di ogni riga. Presumo che non ci sia il riconoscimento ottico carattere coinvolto (ma OMR ), questo dovrebbe essere in qualche modo più facile.

C'è un modo per farlo dalla GUI o dalla riga di comando? Quale sarebbe l'approccio migliore?

AGGIORNATO : le scansioni sono disponibili in PDF o JPEG (a mia scelta). Scansione campione (380kb JPEG).

Ecco una versione anonima del modulo:

    
posta myhd 05.10.2013 - 15:12
fonte

2 risposte

4

Se vuoi evitare l'OCR, puoi usare ImageMagick (un toolset di manipolazione di immagini CLI). Ma devi essere sicuro che tutte le pagine siano allineate esattamente allo stesso modo. Ho hackerato insieme questo flusso di lavoro, devi modificarlo per le tue esigenze e creare alcuni cicli, ma può aiutarti nella giusta direzione.

Fai in modo che la posizione di ogni turno sia la stessa su ogni foglio

Estrai ogni round e salvalo con row_circle-nr (come 04_1.png, 04_2.png, ecc.)

x=$position_of_circle_on_x
y=$position_of_circle_on_y
w=$width_of_circle_area
h=$hight_of_circle_area
input=$input_image
output=$output_row_cirleNr
convert +repage $input -crop $wx$h+$x+$y $output

Calcola l'area del rosso utilizzando gli istogrammi ( Preferisco il rosso, ma puoi farlo anche per i neri )

RGBO=$( convert $FILE -colorspace HSL -verbose info: | grep mean | awk '{print $2}' )
REDVALUE=$( echo $RGBO | awk '{print $1}'  | cut -d. -f1 )

Il più grande REDVALUE vince per ogni riga

Bene, questo è tutto.

Come installare imagemagick?

L'uso e l'installazione di ImageMagick possono intimidire, ma questo pacchetto di manipolazione delle immagini è il più potente che ho incontrato finora. Poiché l'installazione da origine può essere una seccatura per gli utenti nativi di OS X, ti consiglio di utilizzare Homebrew .

Per installare ImageMagick utilizzando Homebrew esegui questo oneliner nel tuo terminale:

ruby -e "$(curl -fsSL https://raw.github.com/mxcl/homebrew/go)"

Homebrew è ora installato, è consigliabile seguire i suggerimenti dell'installatore dopo l'installazione. Ora installiamo ImageMagick usando brew .

brew install imagemagick

Ora possiamo usare imagemagick e il suo strumento convert come negli esempi sopra.

    
risposta data 10.10.2013 - 12:06
fonte
1

Sono un entusiasta dell'open source così ho dato un'occhiata a ImageMagic per vedere se è open source, lo è, comunque il progetto è basato negli Stati Uniti. Voglio vedere se posso aiutarti con una base di progetto open source universitaria tedesca chiamata SDAPS.

SDAPS è specificamente un programma OMR.

link

Ho scaricato la pagina di test e cercherò di utilizzarla per fornire una risposta alla tua domanda utilizzando SDAPS.

    
risposta data 15.10.2013 - 03:40
fonte

Leggi altre domande sui tag