In tutta onestà: la traduzione in linguaggio naturale è così incredibilmente , pazzesca, follemente, difficile in generale che la scelta della lingua è completamente e assolutamente irrilevante. Anche durante la programmazione in Malbolge , il tuo 99,9999999% del tuo tempo, impegno, risorse, manodopera e denaro saranno spesi ricercare e inventare gli algoritmi piuttosto che implementarli.
Esistono fondamentalmente due approcci noti alla traduzione automatica che "funzionano" (come in "producono risultati leggermente migliori di quelli della completa spazzatura"): l'approccio classico e l'approccio di Google:
-
approccio classico :
- assumere una decina di ricercatori (in alternativa: donare un paio di milioni di dollari a un'università)
- aspetta vent'anni
-
Approccio di Google :
- crea un database di tutto ciò che è mai stato scritto nell'intera storia dell'umanità
Il modello - corrisponde al testo di input rispetto ai documenti in cui è stato scritto lo stesso documento sia nella lingua di origine che in quella di destinazione da cui si desidera tradurre e in
C'è anche un terzo approccio che IMO funziona meglio:
- utilizza l'API di Google Traduttore
Ora, se insisti a farlo da solo, ogni volta che ascolti le parole "basato su regole", dovresti pensare a linguaggi come Prolog e Mercury o DSL incorporati come KANREN e miniKANREN .