Sarebbe difficile esaminare gli invii di moduli (ad es. commenti) per non parole / non frasi?

4

Ultimamente ho pensato molto alla necessità di una migliore sicurezza dei moduli e di buoni modi per farlo.

Al momento utilizziamo i codici captcha per lo screening dei bot, ma questo è fastidioso per gli utenti e potrebbe non funzionare per sempre.

Penso che abbiamo bisogno di un sistema organico più intuitivo per lo screening di commenti negativi / invio di moduli di contatto.

Un'opzione che è venuta in mente sarebbe provare a visualizzare i commenti per cose che ovviamente non sono parole, oltre allo screening di commenti duplicati. Ad esempio, quando uno spammer su Facebook, Twitter o una sezione di commenti viene interrotto dal solo postare la stessa cosa un sacco di volte, aggiungono lettere incomprensibili o numeri da qualche parte nel post per renderlo "unico".

Se fosse possibile escludere un evidente non-testo, questo potrebbe essere superato. Se potessi fare un ulteriore passo avanti e schermare post che ovviamente contengono parole inserite senza motivo, tranne che per rendere il post "unico", potresti costringere l'autore dello spammer / truffatore a usare solo le opzioni post ripetitive che in realtà hanno senso grammaticale .

Per lo meno, potresti avere dei post contrassegnati per l'attenzione del moderatore se sembravano simili ma che avevano appena aggiunto spazzatura casuale senza motivo. Ciò ridurrebbe in modo significativo la capacità di uno spammer di mantenere lo spamming, anche su più account.

Potrebbe essere possibile schermare i risultati dei campi della form per combinazioni casuali di parole e numeri e le parole inserite per rendere un post "unico"?

    
posta Code Junkie 20.02.2012 - 20:50
fonte

2 risposte

3

Puoi prendere in prestito vari filtri bayesiani dalle app di posta elettronica. Ci sono alcuni open source in cui puoi imparare e costruire la tua implementazione. Il problema è che gli spammer asunci utilizzano lo stesso codice per creare le loro app di generazione di testo per evitare i filtri.

Il modo migliore che ho trovato per prevenire la maggior parte dello spamming automatico e per evitare i problemi di esperienza utente con CAPTCHA è di avere un metodo di convalida AJAX che ostacolerà i bot e si degraderà con garbo per usare il codice lato server per utenti non Javascript. Questo non aiuterà lo spamming manuale a pagamento in cui qualcuno in un Internet café del terzo mondo viene pagato $ 5 per inserire un collegamento sul numero X di siti.

Quello che ho trovato è che combinando lo script sul front end con la moderazione automatica sul backend (contrassegnando alcune parole e frasi, post con collegamenti e così via) si ferma circa il 99,9% dei tentativi di spam. Gli unici che riescono sono quelli che sono ben fatti manuali e quelli sono piuttosto rari.

    
risposta data 20.02.2012 - 21:58
fonte
0

Un problema con questo: acronimi. A volte le persone pubblicano non parole senza che siano prive di senso. Ho chiesto all'IRS se potevo portare il mio 401k su un Roth IRA. Tre non parole in una sola frase senza filtro-esca.

    
risposta data 21.02.2012 - 06:27
fonte

Leggi altre domande sui tag