Un OCR di font per immagini di meme

1

Sto codificando un riconoscimento ottico dei caratteri specifico per le immagini dei meme di Internet . Questo è un progetto scolastico e dovrebbe essere codificato in C.

Attualmente sto riscontrando problemi con il metodo / gli algoritmi che utilizzerò per codificare il mio OCR. Infatti, quasi tutte le immagini dei meme hanno lo stesso font che è Impact (non importa per gli altri che non hanno il font Impact). L'obiettivo OCR sarà quello di rilevare e riconoscere i caratteri, che sono nel tipo di carattere Impatto, in primo piano nell'immagine del meme e non nella scena dietro di esso.

Per fare questo OCR, voglio dire che una rete neurale è un po 'esagerata perché i caratteri nell'immagine del meme sono semplici, diretti e avanzati . Ho sentito che ci sono altri modi "più semplicemente" per fare un OCR come utilizzare un algoritmo di apprendimento automatico per "apprendere" il font Impact o utilizzare un sistema basato sulla corrispondenza dello scheletro per riconoscere i caratteri mediante il riconoscimento dei pattern.

Qual è il modo migliore per fare il mio OCR? Piuttosto una rete neurale? Un riconoscimento di pattern? Apprendimento automatico?

    
posta Yannick Utard 28.03.2016 - 15:15
fonte

1 risposta

3

Probabilmente è possibile il riconoscimento della forza bruta della maggior parte dei caratteri, una volta determinato il rettangolo di selezione, visualizzando i caratteri più comuni su di essi (ad esempio ASCII stampabile) e osservando la differenza.

Ho ancora il sospetto che una rete neurale piuttosto semplice potrebbe fare molto più velocemente se la si alimentasse con blocchi relativamente grandi della lettera sospetta (ad esempio una matrice 8 x 10 o anche più grossolana), con qualsiasi contenuto colorato rimosso / sostituito di un colore, poiché le lettere dei meme sono generalmente bianche con un bordo nero. La rete dovrebbe però essere addestrata.

    
risposta data 28.03.2016 - 18:12
fonte

Leggi altre domande sui tag