Questa è una (a mio parere) cosa interessante con cui sto lottando. Sto costruendo questa app che dovrebbe essere in grado di leggere i contatori. Come con qualsiasi applicazione OCR, questo significa che devo isolare i caratteri per renderli più facili da riconoscere.
Ci sono alcuni ostacoli però. Ad esempio, la fotocamera utilizzata da un utente potrebbe non essere della stessa qualità di quella sul mio dispositivo di test. L'utente potrebbe provare a eseguire la scansione di un contatore di utilità in un ambiente più scuro. Oppure un contatore di cifre potrebbe essere tra due cifre.
Tutto ciò mi ha fatto pensare quale sarebbe stato l'approccio migliore per dare il miglior risultato. Sarebbe meglio perfezionare l'isolamento delle cifre o dovrei addestrare l'algoritmo di riconoscimento con i dati inquinati?
L'introduzione di dati inquinati nel set di allenamento potrebbe rendere il riconoscimento meno accurato, ma perfezionare l'isolamento sembra un compito impossibile (specialmente su Android poiché non si possono fare molte ipotesi sulla fotocamera). Sono curioso di leggere le tue opinioni su questo.