Come funziona l'avvelenamento bayesiano?

24

Questa risposta parla di avvelenamento bayesiano di passaggio e ho letto wikipedia pagina ma non mi sento di averla pienamente afferrata.

Il primo caso, in cui uno spammer invia spam con un payload (link, file dannoso, ecc.) e include molte parole "sicure" non spam, sembra abbastanza ovvio. L'obiettivo è di aumentare la valutazione di quella singola email in modo che i filtri antispam possano classificarla come "non spam".

Il secondo caso è più sottile e (per me) confuso:

Spammers also hope to cause the spam filter to have a higher false positive rate by turning previously innocent words into spammy words in the Bayesian database (statistical type I errors) because a user who trains their spam filter on a poisoned message will be indicating to the filter that the words added by the spammer are a good indication of spam.

In che modo questo aiuta lo spammer? Certo, i falsi positivi (se ho capito correttamente che questo significa che le e-mail legittime erroneamente classificate come spam) sono fastidiose, ma sarebbe molto comune disabilitare completamente i filtri anti-spam. Non sembra che questo cambierebbe la valutazione delle parole di spam reale, o influisce solo sulla valutazione relativa ?

Infine, questo approccio, o qualsiasi altro, aiuta un singolo spammer con alcune parole spam che vorrebbe intrufolarsi nei filtri, o potrebbe aiutare tutti gli spammer?

Qualcuno potrebbe fornire o collegare una spiegazione basata su un esempio?

    
posta James Bradbury 19.11.2014 - 11:10
fonte

3 risposte

21

C'è un buon documento pubblicato risposta data 19.11.2014 - 11:41

fonte
17

La risposta di Lucas Kauffman spiega come, per quanto riguarda il perché:

Se l'utente non riesce a ricevere e-mail importanti e risulta che sono stati catturati nel filtro antispam allora si arrabbieranno con il loro amministratore. I falsi positivi possono avere un costo molto alto.

Quando molti utenti si arrabbiano con l'amministratore, è probabile che l'amministratore cambi le cose in modo che il filtro antispam sia più indulgente, il che probabilmente finirà per lasciare più spam attraverso il quale è buono per gli spammer.

    
risposta data 19.11.2014 - 19:05
fonte
4

Ho un ottimo esempio di messaggio spam con avvelenamento bayesiano in un vecchio post del blog .

I filtri antispam bayesiani tengono sostanzialmente traccia di ogni parola usata in ogni messaggio. Quando un messaggio è contrassegnato come spam, il filtro considera le parole nel messaggio come rappresentative dello spam. Utilizzando queste informazioni, il filtro può determinare con esattezza se un determinato messaggio è spam o meno.

Tuttavia, il fatto che i filtri bayesiani utilizzino le parole di ciascun messaggio per determinare se un messaggio è spam rende suscettibile alle tecniche che aggirano questo processo.

Un messaggio spam può inserire parole senza senso, separare le parole in modo leggibile dall'uomo (ma non leggibile dalla macchina) (ad es. lettere minuscole "invisibili" tra ogni lettera nella parola spam), usa accenti o entità HTML per rendere più difficile distinguere i filtri o utilizzare moduli HTML al posto dei collegamenti. Questo è essenzialmente ciò che è avvelenamento bayesiano, e tutte queste tecniche sono dimostrate e spiegate nel mio post sul blog.

In particolare, le "parole senza senso" possono essere scelte con attenzione per essere quelle che si trovano comunemente nei messaggi normali. Un utente che contrassegna un messaggio spam contenente queste parole come spam indica essenzialmente al filtro di considerarle come un'indicazione di spam. Con un numero sufficiente di messaggi di questo tipo, il filtro penserà che queste parole rappresentano spam e iniziano a contrassegnare messaggi legittimi contenenti tali parole in quanto tali.

La prima immagine nel post del blog mostra come viene eseguita:

Messaggio di spam nell'ispettore di pagina Firefox:
View full size

Anche se le frasi complete non hanno molto senso, sembrano un po 'coerenti. "Sorridendo", "Dio sapeva che aspettava" e "Dietro il letto" sono tutte frasi e parole che possono apparire nei normali messaggi. Se questi tipi di frasi appaiono abbastanza spesso nei messaggi di spam e l'utente li contrassegna come spam, il filtro potrebbe finire per pensare che i messaggi legittimi con queste frasi siano spam.

    
risposta data 19.11.2014 - 20:09
fonte

Leggi altre domande sui tag