Sto cercando di sviluppare un correttore ortografico JavaScript che non usi un dizionario, e posso correttamente, dato una singola parola, rilevare se una parola è scritta correttamente o meno. In questo momento, ho solo una lista di sottostringhe che non si verificano mai all'interno delle parole, e se la parola contiene una di queste stringhe, la considero come errata. Ad esempio, avrei una sottostringa "lll", e se una parola contiene "lll" sarebbe conteggiata come errata (come "I'lll").
Tuttavia, sto scoprendo che questo non funziona come previsto. La maggior parte delle parole errate sembrano implicare lettere nell'ordine sbagliato o parole che non seguono regole comuni. L'approccio sopra riportato non funziona per nessuno di questi problemi. Ad esempio, non esiste una sottostringa valida per l'ortografia "accidant".
Sto cercando un metodo più efficace per determinare se una parola è probabilmente errata o meno, idealmente qualcosa che risolve i problemi delle lettere in ordine errato e le chiavi vicino alla lettera corretta su una tastiera accidentalmente premuta (ma le soluzioni per altre cause comuni di errori di ortografia vanno bene).
Questo è solo in inglese, quindi non ha bisogno di lavorare con altre lingue. Inoltre, i falsi positivi sono per me un problema molto più grande dei falsi negativi, quindi preferirei sbagliare dicendo che le parole sono scritte correttamente quando in realtà non lo sono.