Modifica: la domanda ora dice "milioni di nuovi personaggi". Questo semplifica la risposta:
No . Utf-8 è una codifica Unicode. Unicode ha uno spazio di codice che consente 1.114.112 distinti codepoint e meno di un milione non è attualmente assegnato. Quindi non è possibile supportare milioni di nuovi caratteri in Unicode. Per definizione, nessuna codifica Unicode può supportare più caratteri di quelli definiti da Unicode. (Ovviamente puoi imbrogliare codificando un livello ulteriormente - qualsiasi tipo di dati può essere rappresentato da solo due caratteri dopotutto).
Per rispondere alla domanda originale:
Unicode non supporta le lingue in quanto tali, supporta i caratteri: i simboli utilizzati per rappresentare la lingua in forma scritta.
Non tutti i linguaggi umani hanno una rappresentazione scritta, quindi non tutte le lingue umane possono essere supportate da Unicode. Inoltre molti animali comunicano ma non hanno una lingua scritta. Le balene ad esempio hanno una forma di comunicazione abbastanza complessa da chiamare una lingua, ma non ha alcuna forma scritta (e non può essere catturata nemmeno dalla notazione fonetica esistente). Quindi nemmeno tutte le lingue sulla terra possono essere supportate da Unicode.
Ancora peggio è qualcosa come il linguaggio delle api. Non solo non ha una forma scritta, non può essere rappresentato in modo significativo in forma scritta. Il linguaggio è un tipo di danza che punta in una direzione ma si basa sulla posizione attuale del sole. Pertanto la danza ha solo valore informativo nel luogo e nel momento in cui viene eseguita. Una rappresentazione simbolica o testuale dovrebbe includere informazioni (posizione, posizione del sole) che la lingua delle api attualmente non può esprimere.
Anche una forma di comunicazione scritta o simbolica potrebbe non essere possibile rappresentare in Unicode. Ad esempio illustrazioni o fumetti senza parole non possono essere supportati da Unicode poiché l'insieme di glifi non è finito. Noterai molta comunicazione pittorica in ambienti internazionali come un aeroporto, quindi non è inconcepibile che una razza di alieni che viaggiano nello spazio si siano evoluti per usare un linguaggio pittorico.
Anche se una razza aliena aveva una lingua con un sistema di scrittura con un insieme finito di simboli, questo sistema potrebbe non essere possibile supportare in Unicode. Unicode prevede che la scrittura sia una sequenza lineare di simboli. La notazione musicale è un esempio di un sistema di scrittura che non può essere completamente rappresentato in Unicode, poiché il significato è codificato sia nella scelta dei simboli che nel posizionamento verticale e orizzontale. (Unicode supporta simboli musicali individuali, ma non può codificare una partitura.) Una razza aliena che comunicava usando la musica polifonica (non rara) o un canale di comunicazione di complessità simile, potrebbe benissimo avere un sistema di scrittura simile a una partitura orchestrale, e Unicode non supporta questo.
Ma lasciamo supporre che tutte le lingue, anche quelle aliene, possano essere espresse come una sequenza lineare di simboli selezionati da un insieme finito. Unicode è abbastanza grande per un'invasione aliena? Unicode ha attualmente meno di un milione di codepoint non assegnati. La lingua cinese contiene centinaia di migliaia di caratteri in base al dizionario cinese più completo (non tutti sono attualmente supportati da Unicode come caratteri distinti). Quindi solo dieci lingue con la complessità del cinese userebbero tutto l'Unicode. Sulla terra abbiamo centinaia di sistemi di scrittura distinti, ma per fortuna molti sono alfabetici piuttosto che ideografici e quindi contengono un piccolo numero di caratteri. Se tutte le lingue scritte usassero ideogrammi come il cinese, Unicode non sarebbe nemmeno abbastanza grande per la terra. L'uso dell'alfabeto deriva dal linguaggio che utilizza solo un numero limitato di fonemi, ma è specifico per la fisiologia umana. Quindi anche un singolo pianeta alieno con solo una dozzina di sistemi di scrittura ideografici potrebbe superare ciò che Unicode può supportare. Considerate ora se questo alieno ha già invaso altri pianeti prima della terra e ha incluso i loro sistemi di scrittura nell'insieme di personaggi che devono essere supportati.
L'espansione o la modifica delle codifiche attuali o l'introduzione di nuove codifiche non risolveranno questo problema, poiché la limitazione è nel numero di punti di codice supportati da Unicode.
Quindi la risposta è molto probabilmente no.