Da un testo scritto di un autore se un programma di computer analizza il testo, quanto può oggi dire un programma per computer all'autore di alcuni testi (abbastanza lunghi da essere statisticamente significativi)?
Può il programma per computer dire anche con "certezza" se un uomo o una donna ha scritto questo testo basandosi esclusivamente sul contenuto del testo e non su un'indagine come numeri ip, ecc.?
Sono interessato a sapere se ci sono algoritmi in uso per esempio per sapere automaticamente se un autore è maschio o femmina o caratteristiche simili di un autore che un programma per computer può decidere in base alle analisi del testo scritto di un autore.
Potrebbe essere utile sapere prima di leggere un messaggio che cosa dice un computer sull'autore, sei d'accordo? Se per esempio ricevo un messaggio più lungo da mia moglie che lei abbia avuto un incidente in Nigeria e il programma informatico dice che con una probabilità del 99% il messaggio è stato scritto da un autore maschile di sessantanove anni non di origine caucasica o allo stesso modo, o qualcuno che non è mia moglie, allora il programma per computer potrebbe aiutarmi a capire perché un determinato messaggio differisce nelle caratteristiche.
Potrebbero esserci anche altri usi, ad esempio solo la rilevazione di valori anomali in un set di dati più grande geograficamente o demograficamente limitato.
Il rilevamento delle truffe è l'uso ovvio a cui sto pensando, ma potrebbero esserci anche altri usi. Esistono già programmi che analizzano un testo scritto per raccontare qualcosa sull'autore in base alla scelta delle parole, all'uso di pronomi, all'uso insolito della lingua o allo stesso modo?