Implementazione della classificazione del testo

0

Ho cercato di implementare un sistema di classificazione del testo. Ha bisogno di leggere un file di testo ed estrarre le parole e la parola frequenza. Finora, avevo intenzione di analizzare le parole, metterle in un dizionario e salvarle in un file XML. Sto usando C ++ / CLI.

Questa è una buona implementazione o esiste un'implementazione più semplice o migliore?

Può essere una domanda correlata (implementazione di codice): link

    
posta Hearty 17.05.2012 - 19:46
fonte

1 risposta

1

Sì, potrebbero esserci soluzioni migliori ma, dato il tuo status di "principiante", qual è l'obiettivo di meglio; puoi ottimizzare la velocità o la portabilità.

Una struttura di dati binari che potrebbe essere acceduta in modo casuale sarebbe più veloce, in quanto XML è solo un formato di scambio di dati; questo naturalmente lo rende perfetto per la portabilità.

Avrai comunque bisogno di una struttura dati binaria, mentre stai analizzando le parole, finché non sei pronto a scrivere l'XML.

    
risposta data 09.10.2012 - 11:33
fonte

Leggi altre domande sui tag