I sistemi finanziari di solito bloccano le transazioni per la revisione, sulla base di una certa valutazione del rischio. E così anche i sistemi di filtraggio dei blog post.
Un approccio molto semplice è identificare ampie categorie di rischi correlati. Ecco un esempio molto semplificato:
Blog system Financial system
--------------------------- -----------------------------------
1.Risk of loosing readers Risk of loosing money
1.1 spammer - market losses
1.2 offensive content - fraud
1.3 boring content
2.Risk of being sued Regulatory risk
Avresti quindi punteggi per categoria. Potresti quindi progettare un sistema di regole molto semplice, che passa attraverso tutte le regole. Le nuove regole vengono aggiunte al set. Ma invece di avere un singolo punteggio arbitrario che rovina tutto, la regola aggiornerebbe i punteggi nelle categorie pertinenti:
Risk components 1.1 1.2 1.3 2.
post->hasOneFrequentlyUsedSwearWord() 1
post->hasTooManySwearWords() 2
post->hasRacistTerms() 5 10
post->isLongerThan100Words() 2
post->hasManyRedundantTerms() 3
author->howManyPostsThisMonth() 5
Questo ti consente di analizzare più facilmente come interagiscono le regole. Ma il più grande vantaggio di questa separazione di preoccupazioni è che è possibile definire il processo decisionale indipendentemente dalle singole regole e decidere come combinare al meglio i punteggi. Puoi utilizzare diversi approcci nello stesso tempo, ad esempio:
- Combina alcuni punteggi correlati come 1.1, 1.2 e 1.3 (ad esempio aggiungendo semplicemente i sub-punteggi, ponderandoli se necessario o prendendo il massimo dei 3 valori) ma non 2.
- Avere diverse scale per diverse categorie di rischio (per la perdita finanziaria, si calcola certamente la quantità potenziale di perdita).
- Utilizza soglie diverse per diverse categorie. Ad esempio potresti essere rischioso e fermare ogni post che causa un rischio, ma essere più permissivo con l'ascia di noia, perché è più soggettivo.
- Decidi di non fermarti a causa di un punteggio molto basso in una delle categorie (in un sistema finanziario, non ti fermerai per una transazione di valore molto basso, perché l'intervento umano sarebbe più costoso della perdita).
Naturalmente, non è sofisticato come i filtri Baysian, gli algoritmi genetici o le reti neurali. Ma anche se non è l'approccio più avanzato, è molto flessibile e rappresenta un buon inizio rispetto al tuo punteggio attuale monodimensionale.