Per un progetto, devo classificare un elenco di transazioni bancarie in base alla loro descrizione.
Supose Ho 2 categorie: salute e intrattenimento. Inizialmente, le transazioni avranno le informazioni di base: data e ora, ammontare e una descrizione fornita dall'utente. Ad esempio:
Transaction 1: 09/17/2012 12:23:02 pm - 45.32$ - "medicine payments"
Transaction 2: 09/18/2012 1:56:54 pm - 8.99$ - "movie ticket"
Transaction 3: 09/18/2012 7:46:37 pm - 299.45$ - "dentist appointment"
Transaction 4: 09/19/2012 6:50:17 am - 45.32$ - "videogame shopping"
L'idea è di usare quella descrizione per classificare la transazione. 1 e 3 andrebbero nella categoria "salute" mentre 2 e 4 andrebbero in "intrattenimento".
Voglio utilizzare l'API di previsione di google per farlo. In realtà, ho 7 diverse categorie, e per ognuna, molte parole chiave relative a quella categoria. Ne userei alcuni per l'allenamento e altri per i test.
È persino possibile? Voglio dire, per determinare la categoria data poche parole? Inoltre, il numero di parole non è necessariamente lo stesso su ogni transazione.
Grazie per qualsiasi aiuto o guida! Molto apprezzato
Soluzione possibile: link