Questa è una specie di avvelenamento bayesiano?

4

Quindi ho letto il mio spam ultimamente e oggi ho ricevuto questo:

A: la mia e-mail effettiva, ma con un nome trovato qui: tel2name.com (colpito solo su Google)

Oggetto: un estratto apparentemente casuale di una pagina web trovata qui: (solo colpito su Google) link

che cita "RCA" che in questo caso si riferisce a rca nalytics (punto com)

Il corpo stesso è un estratto da questa pagina: link , uno frase che parla di: Gadsden Purchase, l'ostruzionismo e Washington.

Quale potrebbe essere l'obiettivo di questo? Non capisco quale profitto possono ottenere dall'invio di questo, perché non sembra avvelenamento bayesiano?

Inoltre, il corpo è: Content-Transfer-Encoding: base64

    
posta alecail 21.01.2015 - 21:24
fonte

1 risposta

1

Senza ulteriori informazioni (considerare di incollare l'e-mail completa a un pastebin o un gist), non posso dire in modo definitivo quale sia il messaggio, ma dalla tua descrizione, sì, è probabile che lo spam sia un tentativo di avvelenamento .

Quando vedi molte frasi senza senso o senza senso o fuori dal contesto, stai vedendo un hash buster o un avvelenamento bayesiano.

hashing sfocato sistemi come Rasoio misurano varie caratteristiche dei messaggi e arrotolano ogni misura in una piccola stringa ( "hazzy hash") che può essere paragonato agli hash fuzzy dello spam noto. Si presume che le corrispondenze siano nella stessa campagna spam.

Hash-busters tentano di modificare abbastanza contenuti per evitare che gli abbinamenti sfocati di una campagna spam siano corrispondenti. Questa tecnica può funzionare, ma alcuni algoritmi di hash sfocati sono specificatamente progettati per essere robusti, ignorando vaste aree di corpi di messaggi e persino usando hash composti da euristiche indicative di hash buster.

rilevamento dello spam bayesiano calcola le probabilità di spam rispetto a posta legittima ("ham") basata sulle frequenze osservate di ogni parola nel prosciutto e nello spam (ad esempio "v1agra" è molto spammoso, ma "Niagara" è molto hammy). Questi vengono quindi combinati in una probabilità di spam per l'intero messaggio, che è considerato spam ad una certa soglia.

l'avvelenamento bayesiano cerca di aggiungere contenuti plausibili nel prosciutto. La teoria è che la probabilità di spam si sarebbe abbassata con l'inclusione di un intero gruppo di parole di hammy. Fortunatamente, non è questo il caso. Poiché Bayes viene costantemente aggiornato su spam non catturato, apprenderà che queste distrazioni sono irrilevanti e porrà maggiore enfasi sui contenuti rimanenti visti solo nello spam. Nella maggior parte dei casi, verrà effettivamente a sapere che l'avvelenamento bayesiano è di per sé un segnale di spam.

Mentre l'avvelenamento bayesiano può essere efficace nell'hash busting, è controproducente ad avvelenare i filtri bayesiani; uno dei migliori strumenti anti-spam per combattere sia gli hash che i busting e l'avvelenamento bayesiano è: rilevamento dello spam bayesiano.

Ulteriori informazioni sull'avvelenamento bayesiano

    
risposta data 26.03.2015 - 22:05
fonte

Leggi altre domande sui tag