È appena iniziato un progetto di rilevamento di oggetti per hobby. Il mio obiettivo è comprendere gli algoritmi di base e, a tal fine, l'accuratezza complessiva dei risultati è (attualmente) più importante del tempo di esecuzione effettivo.
Sto iniziando a cercare un buon algoritmo di segmentazione dell'immagine che fornisca un buon punto di partenza per la fase di rilevamento degli oggetti. Le immagini target sarebbero scene "reali".
Ho trovato due tecniche che rispecchiano i miei pensieri su come procedere in merito:
-
Segmentazione dell'immagine basata su grafici: link
-
Analisi dei contorni e delle trame per la segmentazione delle immagini: link
Il primo era davvero intuitivo da comprendere e sembra abbastanza semplice da implementare, mentre il secondo era più vicino ai miei pensieri iniziali su come procedere in merito (combinare colore / intensità e informazioni sulla trama per trovare le regioni). Ma è un ordine di grandezza più complesso (almeno per me).
La mia domanda è - ci sono altri algoritmi che dovrei guardare, che forniscono il tipo di risultati a cui sono arrivati questi due documenti specifici? Esistono versioni aggiornate di queste tecniche già in circolazione?
Come accennato in precedenza, l'obiettivo è l'accuratezza relativa della segmentazione dell'immagine (con l'obiettivo finale di raggiungere un grado di accuratezza della rilevazione dell'oggetto) durante l'esecuzione, con l'algoritmo in grado di segmentare un'immagine in "naturale" o percettivamente importante componenti, come fanno questi due algoritmi (ciascuno con estensioni variabili).
Ho trovato questi due documenti dopo un paio di giorni di perfezionamento dei miei termini di ricerca e di apprendimento di nuovi rilevanti per il tipo esatto di tecniche che stavo cercando. Ho appena raggiunto la fine della mia creatività personale su Google, motivo per cui sono finalmente qui!
Non so se questo è più adatto per cstheory.stackexchange (o anche cs.stackexchange). Ho guardato, ma il cstheory sembra più appropriato per complesse discussioni algoritmiche di una vasta domanda come questa. Inoltre, non sono riuscito a trovare nemmeno tag pertinenti! Ma ti preghiamo di muoverti se necessario.