Mi è stato detto di creare due elenchi riguardanti le parole più usate da un testo semplice (10 Mb di testo arbitrario) come monogrammi (per espressioni con una sola parola come human, water, is) e bigrams (per espressioni di due parole come squadra di basket, stati uniti ecc.
Sono bloccato qui e non so come posso farcela! E come posso distinguere tra questi due?
Il mio dominio non è inglese, ho dato solo quegli esempi per rendere più chiara la mia intenzione e il mio significato.