C'è un programma scritto in Java chiamato Anonymouth che aiuta con questo:
Anonymouth is a Java-based application that aims to give users to tools and knowledge needed to begin anonymizing documents they have written. It does this by firing up JStylo libraries (an author detection application also develped by PSAL) to detect stylometric patterns and determine features (like word length, bigrams, trigrams, etc.) that the user should remove/add to help obsure their style and identity.
Da solo, Anonymouth ha un valore limitato. L'anonimizzazione della tua analisi di impronta digitale richiede una conoscenza di base della linguistica e della stilometria. La stitometria di base comprende la cosiddetta analisi a 5 funzioni, in cui vengono analizzate le cinque principali caratteristiche dello stile di scrittura (parafrasato da Wikipedia):
-
caratteristiche lessicali - L'analisi del lessico, la scelta del vocabolario dell'autore. Persone diverse usano parole diverse a velocità diverse, il che può renderle piuttosto uniche. Io, ad esempio, tendenzialmente uso la parola tend . Avrei bisogno di evitarlo se volessi nascondere la mia impronta digitale. L'uso di parole semplici, brevi e comuni può ridurre il potenziale di questa funzione.
-
caratteristiche sintattiche - L'analisi dello stile di scrittura dell'autore e della struttura della frase, come ad esempio: punteggiatura, uso della voce passiva e complessità della frase. L'utilizzo di frasi il più semplici possibile con uno stile di scrittura standard può aiutare a indebolire questa funzione.
-
caratteristiche strutturali - L'analisi dell'organizzazione dell'autore del lavoro. Questi includono la lunghezza del paragrafo, la spaziatura, l'indentazione, l'uso di virgole oxford, ecc. Proprio come rendere meno utile la seconda caratteristica, rendere questa funzione meno utile può essere eseguita seguendo stili di scrittura standard piuttosto che usando uno che si è evoluto naturalmente con te. / p>
-
caratteristiche specifiche del contenuto - L'analisi della lingua che è contestualmente significativa per l'oggetto del lavoro scritto. Gli esempi includono l'uso di slang o acronimi che possono essere shibboleths. Per esempio. un gruppo di proprietari di botnet può essere facilmente diviso in quelli che dicono "C & C", "CnC" e "C2".
-
caratteristiche idiosincratiche - L'analisi degli errori e di altri elementi sgrammaticati che possono essere univoci per l'autore. Questo è di gran lunga una delle caratteristiche più schiaccianti e ha portato a numerose persone che sono state anonimizzate dal loro stile di scrittura. Piccoli errori fatti su un'identità non anonima possono portare a identità anonime, potenzialmente collegandole.
Molte di queste funzionalità possono essere rese anonime utilizzando l'inglese standard con grammatica e spelling completamente adeguati e frasi brevi e semplici. Idiomi e simili dovrebbero essere evitati. È anche possibile emulare altri autori per ingannare l'analisi. Se tutto il resto fallisce, semplicemente aspettare può aiutare. Lo stile di scrittura di una persona va alla deriva nel corso degli anni, quindi è improbabile che un documento creato da te diversi anni fa sia facile da legare a ciò che scrivi ora. Questo non significa che sia impossibile, solo più difficile.