Qual è il modo migliore per riepilogare un valore sentiment per un paragrafo di testo in base al valore sentiment per le frasi al suo interno?

0

Quindi sto utilizzando Stanford CoreNLP nel mio progetto. Ho dati che consistono in recensioni di prodotti su un forum. Devo essere in grado di assegnare un valore sentiment a una determinata recensione. CoreNLP ti consente di prevedere una classe di sentimento di una determinata frase. La classe varia da 0 - molto negativo a 4 - molto positivo. Come faccio a combinare i valori sentimentali delle frasi in un valore finale che dà il sentimento per l'intera recensione.

È ponderata la media del modo corretto per farlo? Viene calcolata in modo esponenziale una media di un'opzione? Oppure ci sono altri metodi come la media che forniscono un modo più completo per riassumere un elenco di classi previste?

    
posta user238607 28.06.2017 - 19:11
fonte

1 risposta

1

Fai una revisione ipotetica di una domanda ipotetica:

Interesting question ! You made my day ! I have never seen this before. This is such an opinion based crap that it should never ever been asked here ...

Quindi, frase per frase, la valutazione potrebbe essere simile a: 1- > 4, 2- > 3, 3- > 2, 4- > 0. La media sarebbe di 2,25, un po 'meglio del neutrale, il che ovviamente non è il caso.

Il problema è che applicate le regole dei valori correlati continui a qualcosa di completamente distinto, considerando una relazione in cui potrebbe non esserlo.

Sfortunatamente, non c'è una buona risposta qui e nessuna formula magica. Ecco alcuni meccanismi di ipotesi:

  • media come proponi
  • media ponderata dando alla frase più peso in base alla loro posizione (qui metterei più peso sulle ultime frasi, come in una conversazione, le prime frasi sono introduttive, ma per una recensione potrebbe essere possibile che la regola contraria sia meglio: l'utente dà prima la sua impressione spontanea e poi prova ad aggiungere più prospettiva ma meno sentimento).
  • approccio ottimistico o pessimistico, prendendo il massimo o il minimo di tutte le frasi.
  • calcolare la media degli aspetti positivi, degli aspetti negativi medi e assumere il valore assoluto massimo sia positivo che negativo e ridurlo di un fattore del valore per il sentimento opposto. Quindi 10 sentimenti negativi minori potrebbero essere superati da 2 estremamente positivi.
  • stesso principio, ma guarda il più frequente e il più frequente negativo

Ci sono anche molte altre alternative, quindi la prima cosa che devi fare è guardare 50 recensioni e fare la tua valutazione complessiva, e simulare i diversi approcci cercando di capire perché differiscono / convergono con la tua sensazione.

Se hai abbastanza risorse, invece di cercare una formula, usa un approccio ML per consentire al tuo sistema di imparare come combinare le valutazioni in base ai tuoi campioni.

    
risposta data 28.06.2017 - 21:24
fonte

Leggi altre domande sui tag