Qual è un buon modo per memorizzare / caricare un elenco di parole con migliaia di voci?

4

Sto lavorando a un progetto che richiede un dizionario semplice per il controllo ortografico; sarà grande, ma mancherà di definizioni. La soluzione su cui stiamo lavorando ha l'elenco delle parole di base in un file di testo e le personalizzazioni (parole extra, parole escluse) nel DB.

L'intero elenco deve essere caricato (meglio conservato nella cache, credo) per la visualizzazione e la personalizzazione impaginate utilizzando un widget JS esistente, quindi qual è il modo migliore per archiviare e caricare l'elenco delle parole di base?

Il mio pensiero iniziale era di avere un file di testo con una parola per riga e scrivere il mio caricatore e l'oggetto cache, ma il mio capo suggerì di usare un ResourceBundle per sfruttare la cache incorporata. Sto pensando che potrebbe essere fatto usando le parole come chiavi con valori vuoti e usando il keyset del pacchetto.

Quale sarebbe la migliore soluzione a questo?

    
posta Mike Partridge 25.08.2011 - 14:55
fonte

2 risposte

7

In generale, la struttura dei dati che stai cercando si chiama TRIE .

Se stai cercando di implementarlo in javascript, assicurati di leggere il blog di John Resig su questo argomento . Ha valutato diverse tecniche per un problema simile, altamente raccomandato.

Inoltre, dai un'occhiata a questa domanda stackoverflow.com per trovare le implementazioni java .

    
risposta data 25.08.2011 - 16:30
fonte
1

È questo per un linguaggio che non ha già file di dizionario là fuori? Non sono sicuro al 100%, ma ero abbastanza sicuro che i dizionari open source di Aspell fossero disponibili per gli sviluppatori ...

    
risposta data 25.08.2011 - 15:16
fonte

Leggi altre domande sui tag