Questa è una sorta di follow-up di questa domanda sulle direzioni della ricerca NLG nel campo della linguistica.
In che modo gli strumenti dell'assistente personale come Siri, Google Now o Cortana eseguono la generazione in linguaggio naturale (NLG)? In particolare, la parte di frase di testo . Non mi interessa la parte text-to-speech, solo la parte di generazione del testo.
Non sto cercando esattamente come ciascuno lo fa, in quanto tali informazioni non sono probabilmente disponibili.
Mi chiedo quale setup è necessario per implementare la generazione di frasi di quella qualità?
- Di quale tipo di dati avresti bisogno in un database (ad alto livello)?
- Richiede avere un dizionario di ogni parola possibile e il suo significato, insieme a molti libri / corpus annotati e analizzati statisticamente?
- Richiede effettivamente che le persone registrino le conversazioni in modo naturale (ad esempio da programmi TV o podcast), trascrivendole in testo e aggiungendole in qualche modo al loro "sistema"? (per ottenere frasi veramente "umane")
- O ci sono solo semplici schemi di frase basati sulla sintassi che stanno usando, senza un gigantesco database "significato" semantico? Dove qualcuno ha appena scritto una serie di espressioni regolari tipo cosa ..
- Quali sono gli algoritmi che vengono utilizzati per frasi simili a quelle umane scritte in modo naturale?
Una delle ragioni per cui ci si chiede è che sembra che il campo NLG sia molto lontano dall'essere in grado di fare ciò che Siri e Google Now e altri stanno realizzando. Quindi che tipo di cose stanno facendo? (Solo per la parte di generazione del testo della frase).