Password Cracking Mandarin Words Set di caratteri inglesi

1

Cercherò di eseguire una verifica della password di dominio in cui l'utente userà caratteri inglesi, ma potrebbe essere al 40% di diffusori mandarino, quindi prevedo un gran numero di nomi, frasi o parole scritte per essere mandarino ( ma scritto usando set di caratteri inglesi).

Mi piacerebbe eseguire un attacco ibrido e quindi spero di espandere il mio elenco di dizionari per includere frasi / parole / nomi non inglesi, ma ho digitato il set di caratteri in inglese.

Qualcuno sa di una risorsa che si adatta a questa descrizione o ha accesso a tale dizionario / elenco di parole? Ho fatto qualche ricerca su google, ma non sono riuscito a trovare molto.

Apprezzo qualsiasi input.

    
posta nopnosrac 28.07.2014 - 21:15
fonte

3 risposte

3

Non parlo cinese, ma credo che la parola operativa da usare per le tue ricerche su Google sia "pinyin". Questo è il metodo ufficiale di codifica del testo cinese in caratteri latini (che non è l'unico, però). Quindi vuoi "liste di parole mandarino in pinyin".

Con questi termini, trovo questo dizionario scaricabile che sembra promettente. Nel file .u8 , si troveranno linee come questa:

 北極熊 北极熊 [bei3 ji2 xiong2] /polar bear/

con la trascrizione pinyin tra parentesi quadre [ e ] . Dovresti essere in grado di creare un elenco di parole da questo file.

    
risposta data 28.07.2014 - 22:01
fonte
0

È necessario esaminare l'IME cinese (Input Method Editor) fornito con Windows e anche quelli di terze parti. Tutti funzionano quasi sempre allo stesso modo. Fondamentalmente si digita una parola digitando caratteri latini che lo emettono, quindi il computer presenta un elenco di possibilità e ne selezioni uno da un menu. Quando scrivi le password, la maggior parte dei cinesi inserisce solo i suoni, ad es. "Xeixei".

    
risposta data 29.07.2014 - 17:05
fonte
0

Direi che l'attacco al dizionario basato su parole è più una pratica linguistica alfabetica e non così efficace su una lingua basata sui caratteri come il cinese.

La maggior parte dei caratteri cinesi può essere vista come "parole" da sola e i cinesi spesso pensano in unità di caratteri anziché in parole. Ad esempio, usano 字典 (letteralmente "libro di caratteri", dizionario di caratteri) invece di 词典 ("dizionario di parole", dizionario di parole). Quindi è naturale per un cinese trovare sequenze di caratteri che abbiano senso ma non compaiono in nessuna lista di parole (è come la versione cinese di passw0rd ).

Ad esempio, l'esempio nella risposta di Tom, 北极熊 , è composto da 北 (nord), 极 (extrme, inteso come polo quando segue 北) e 熊 (orso). Qualcuno potrebbe facilmente trovare 南极熊 (polo sud) come password e questo potrebbe non apparire in nessuna lista di parole in quanto non è una cosa reale. Similmente, i nomi di molte persone non hanno senso come parole e sono molto propensi a usarli nelle password.

Un approccio più completo sarebbe quello di inventare tutte le possibili pronunce sui personaggi in Pinyin e usarle nel tuo dizionario. Sarà come creare un alfabeto per il cinese. Questo potrebbe spiegare perché la "lista delle parole" in alcune fonti è molto più piccola.

Ovviamente puoi aggiungere parole a più caratteri per accelerare il processo.

    
risposta data 12.05.2017 - 20:56
fonte

Leggi altre domande sui tag