Questa risposta parla di avvelenamento bayesiano di passaggio e ho letto wikipedia pagina ma non mi sento di averla pienamente afferrata.
Il primo caso, in cui uno spammer invia spam con un payload (link, file dannoso, ecc.) e include molte parole "sicure" non spam, sembra abbastanza ovvio. L'obiettivo è di aumentare la valutazione di quella singola email in modo che i filtri antispam possano classificarla come "non spam".
Il secondo caso è più sottile e (per me) confuso:
Spammers also hope to cause the spam filter to have a higher false positive rate by turning previously innocent words into spammy words in the Bayesian database (statistical type I errors) because a user who trains their spam filter on a poisoned message will be indicating to the filter that the words added by the spammer are a good indication of spam.
In che modo questo aiuta lo spammer? Certo, i falsi positivi (se ho capito correttamente che questo significa che le e-mail legittime erroneamente classificate come spam) sono fastidiose, ma sarebbe molto comune disabilitare completamente i filtri anti-spam. Non sembra che questo cambierebbe la valutazione delle parole di spam reale, o influisce solo sulla valutazione relativa ?
Infine, questo approccio, o qualsiasi altro, aiuta un singolo spammer con alcune parole spam che vorrebbe intrufolarsi nei filtri, o potrebbe aiutare tutti gli spammer?
Qualcuno potrebbe fornire o collegare una spiegazione basata su un esempio?