Aggiungerò alla risposta di @ Tom Leek un po 'più specifiche su come uno dei filtri di spam aperti più comuni sul mercato (spamAssassin) controlla se qualcosa è spam. Al centro di tutto ciò, si tratta di un semplice insieme di regole (quelle predefinite per l'ultima versione di spamd possono essere trovate all'indirizzo link ), alcuni con controlli molto semplicistici. Prendi, per esempio, la regola secondo cui il tuo specifico messaggio spam potrebbe tentare di andare oltre se c'è un'immagine nell'email (gli spammer tendono a sapere come usare i beacon):
HTML_IMAGE_ONLY_32 : HTML: immagini con 2800-3200 byte di parole
(Ho visto email molto simili a quella che hai citato con un beacon - un png invisibile 1x1 ospitato su un server remoto, usato per sapere se hai aperto l'email)
Quello specifico non è necessariamente un caso di avvelenamento bayesiano in quanto solo terribili filtri antispam registrano una parola di 5 righe come parola. Sta semplicemente tentando di bufferizzare il contenuto - come alcune regole del filtro spam funzionano sulla "molto breve (non richiesta) email = cattiva" regola.
Inoltre, alcuni filtri antispam sono anche configurati per diluire i punteggi di rigore (spamp). Questo non è il caso della maggior parte dei server, dato che in genere è una pessima idea, a causa del motivo sopra evidenziato: con il riempimento di un numero sufficiente di parole "buone", puoi trasformare un punteggio spam +10 in un punteggio spam di +0.5. Questo è banale - copia-incolla da wikipedia.