Sto cercando di capire il modo migliore per raccomandare immagini basate sulle passate classificazioni usando i cluster k-means. Quello che ho fatto è mappare i valori RGB di un insieme di immagini, eseguire un'analisi del cluster di k-means su quei valori RGB e attaccare un "rating" a ciascuna immagine. Questo ha creato celle Voronoi simili a questo grafico . Ho archiviato i centri del cluster e le valutazioni nel mio "set di allenamento".
Il prossimo passo è prendere una nuova immagine e formulare una raccomandazione basata sul set di allenamento delle immagini precedenti. Non sono sicuro di come procedere. Vorrei implementare un processo di filtraggio collaborativo? O devo eseguire ulteriori elaborazioni sui dati?
Non sono sicuro che sia importante, ma sto usando Apache Spark per il progetto. Grazie!
Modifica: il filtraggio collaborativo non è probabilmente il modo migliore di procedere, poiché le funzionalità che vengono confrontate per i prodotti utilizzano più di semplici valutazioni. Ho bisogno di confrontare la somiglianza. Immagino che ciò implicherebbe operazioni con matrici pesanti?
Modifica2: alcuni commenti qui sarebbero fantastici. Quello che sto pensando è la formazione di due set di dati (una valutazione di immagini "sì" rispetto a immagini "no") e quindi l'utilizzo di computeCost
funzione per sviluppare un valore per varianza / bias di un'immagine da confrontare. Il passaggio finale dovrebbe quindi confrontare se l'immagine era più simile al set di dati "sì" o "no", quindi fare una raccomandazione finale. Sono nuovo nell'apprendimento automatico, quindi potrei pensare troppo.