Il tagging manuale del contenuto è un inizio ideale per l'eventuale apprendimento automatico?

2

Sto assemblando un'app mobile che consente agli utenti di cercare, valutare e caricare foto di piatti nei ristoranti. Non ho esperienza di apprendimento automatico (solo FE / BE / Mobile) quindi per il momento stavo pianificando di completare automaticamente le query di ricerca basate sui tag di parole chiave 2.700 che ho assegnato individualmente e correttamente a 10.000 piatti nel db finora. Quindi, per esempio, ho dato ai piatti di pollo fritto l'etichetta, "pollo fritto" e così via.

Ho scelto questa strada per alcuni motivi: alla fine mi piacerebbe implementare e addestrare una sorta di AI per riconoscere gli alimenti dalle foto, sviluppare un grafico della conoscenza di ciò che gli utenti preferiscono e come accennato sopra la ricerca automatica.

Con tutto ciò che viene detto, qualcosa proprio non sembra giusto con questo approccio. Dalla mia inesperienza in questo campo, mi sento solo ingenuo. La mia principale priorità ovvia sarebbe quella di spedire l'app, ma sicuramente apprezzerei se qualcuno potesse indicarmi la giusta direzione. Questo approccio manuale è una perdita di tempo? Come dovrei fare questo? Fammi sapere se sono necessarie ulteriori informazioni. Grazie.

    
posta Carl Edwards 02.05.2018 - 15:33
fonte

2 risposte

4

Stai costruendo un set di allenamento. Questo è usato per insegnare all'IA ciò che vuoi. L'importante è fare attenzione che il set non contenga false note come una tovaglia a scacchi bianchi e rossi ogni volta che si tratta di un piatto di pasta.

Ovviamente tutti noi generalizziamo, ma quando gli umani costruiscono dati di allenamento è incredibilmente facile dare una mancia alla mano senza volerlo.

Perché l'IA pensa che questo husky sia un lupo? Le orecchie? Il naso?

Èlaneve.

hackernoon: cani, lupi, dati Scienza e Perché le macchine devono imparare come gli umani

Così come costruisci il tuo set di allenamento fai attenzione a questo. Ma, anche se stai attento, sii pronto a chiedere alla tua IA perché classifica come è. O finirai per classificare ogni immagine degli alberi come se avessi nascosto un carro armato ogni volta che l'immagine è stata scattata in un giorno nuvoloso 1 .

    
risposta data 02.05.2018 - 16:18
fonte
1

Se non hai altri metodi per generare dati di allenamento, la loro costruzione manuale è l'unico modo. Dopotutto, tutto ciò che non viene fatto automaticamente da un modello di computer è per definizione "manuale".

Con algoritmi più sofisticati, puoi trarre profitto da "apprendimento attivo", ovvero il modello ha una consapevolezza limitata di quali esempi sarebbero particolarmente utili da aggiungere ai dati di addestramento e chiede attivamente all'utente di etichettare specifico esempi piuttosto che qualsiasi cosa attraversi il loro percorso.

    
risposta data 02.05.2018 - 15:57
fonte