Quanto sono stati efficaci i metodi statistici per rompere la crittografia?

2

Se osserviamo come i motori statistici eseguono traduttori on-line e come sono costruiti, vediamo che guardano una nuova lingua e gestiscono un modello statistico su di esso alla ricerca di ciò che probabilmente è la traduzione corretta per, diciamo, dal russo all'inglese.

Certo, la crittografia non è esattamente una traduzione (che potrebbe essere affine all'offuscamento) in quanto è un modo modellato per "scramble" i dati e prendere con sé il codice "descramble". Tuttavia, quando si esamina la capacità di questi motori di costruire modelli per molte lingue, si potrebbe vedere come ogni lingua inizi a sembrare una chiave non ancora scoperta e un codice per il modello statistico.

Esistono attacchi noti che tentano di utilizzare modelli statistici in questo modo per interrompere la crittografia? Sono efficaci? Quali sono le loro mancanze?

    
posta Incognito 20.09.2011 - 15:25
fonte

2 risposte

4

Versione breve:

  • Sì, stai descrivendo un attacco di testo cifrato noto o un'analisi statistica
  • Sono efficaci su crittosistemi obsoleti o carenti e possono essere considerati un kit di test standard e di base per i nuovi sistemi crittografici
  • Le loro carenze sono che i moderni sistemi di crittografia sono progettati per contrastare quel particolare attacco, e la teoria e la pratica di farlo sono ragionevolmente ben comprese in questo momento

Versione serpeggiante:

La traduzione linguistica ha a che fare con una traslitterazione one-to-one o one-to-poche, con riarrangiamenti. Ogni lingua ha un dizionario finito con correlazioni chiare e ogni lingua ha regole che definiscono la struttura in cui vengono messe le parole. Un motore di traduzione si basa su queste correlazioni.

Questo è totalmente diverso dalla crittografia, dove l'obiettivo è quello di rompere matematicamente tutte queste connessioni tra testo chiaro e testo cifrato. Ciò che descrivi ha funzionato bene con i crittosistemi dell'era della seconda guerra mondiale, ma non oggi. Per citare Wikipedia (sempre pericoloso, lo so) " Ogni cifrario moderno tenta di fornire protezione contro gli attacchi con solo testo cifrato. un nuovo standard di progettazione di cifratura di solito richiede molti anni e include test esaustivi di grandi quantità di testo cifrato per qualsiasi distacco statistico dal rumore casuale.

Questo non vuol dire che l'analisi statistica non sia usata o che non possa avere successo. Ad esempio, alcuni dei punti deboli in WEP abilitano gli attacchi statistici per recuperare i testi in chiaro. Tuttavia quando riesce, viene generalmente considerato un caso in cui il progettista della crittografia ha fatto qualcosa di stupido piuttosto che una tecnica di attacco all'avanguardia.

Modifica - Per rinforzare quell'ultima frase, lasciatemi citare dalle conclusioni del documento WEP sopra riportato: "I problemi di [WEP] sono il risultato di incomprensioni di alcuni primitivi crittografici e quindi di combinare loro in modi insicuri. " Eh.

    
risposta data 20.09.2011 - 16:49
fonte
1

Are there any known attacks that try to use statistical models in this way to break encryption?

Sì. Come notato da gowenfawr, sono in genere efficaci contro una vecchia classe di algoritmi di crittografia chiamati cifrari di sostituzione monoalfabetici. In questi codici una lettera dell'alfabeto viene scambiata con un simbolo. La stessa lettera viene sempre sostituita con lo stesso simbolo. Ad esempio, sostituire ogni a con i e sostituire ogni b con l e così via. Questa semplice sostituzione conserva la natura statistica di ogni lettera. Per attaccare un codice sostitutivo monoalfabetico è sufficiente conoscere la lingua originale utilizzata e la frequenza statistica di ogni lettera. Trova il simbolo più comune nel testo cifrato e sostituiscilo con la lettera più comune nella lingua originale. Per l'inglese la lettera più comune è e.

La prossima progressione dalla sostituzione monoalfabetica è la sostituzione polifabbrica. Questo tipo di cifratura utilizza una tabella di alfabeti per scegliere un symol da sostituire con una lettera di testo semplice. Ciò può efficacemente smussare un attacco statistico (se la chiave è abbastanza lunga) rendendo la sostituzione una funzione della chiave e della lettera invece della sola lettera originale.

Più algoritmi moderni rendono la cifratura di ogni lettera una funzione di molti input che rende molto più difficile il rilevamento di uno schema statistico. Uno degli input è una chiave che di solito è un pezzo di dati casuali. L'uso della casualità come input azzera la capacità di un criptoanalista di rilevare un pattern.

Tuttavia l'analisi statistica può ancora svolgere un ruolo nell'analisi dei dati crittografati. Questo di solito si presenta sotto forma di quello che viene chiamato un attacco di canale laterale. Un canale laterale è una trasmissione di dati che è un effetto collaterale della trasmissione dei dati crittografati. Un recente articolo "Scoprire le frasi parlate nelle conversazioni VoIP crittografate" descrive come la codifica a bit rate variabile ha prodotto un canale laterale per i dati vocali crittografati.

Codifica bit rate variabile

Quando il suono viene convertito in dati diventa bit di informazione. Non tutte le parole e i suoni richiedono la stessa quantità di dati per rappresentarli. Un modo per trasmettere i dati vocali è il bit rate costante. FIl codificatore vocale (non crittografato) converte i suoni in dati che vengono quindi crittografati e trasmessi. Per bit rate costante ogni secondo del suono produce la stessa quantità di dati. Se i suoni prodotti durante quel secondo producono meno bit di quelli che devono essere trasmessi, l'encoder riempie i bit rimanenti con silenzio. Quindi, il bit rate costante ha molti dati privi di significato. Il bit rate variabile consente all'encoder di inviare tanti bit quanti sono stati generati dal suono in base alla dimensione di ciascun campione / frame di suoni che devono essere indicati dai dati. Alcuni algoritmi di crittografia producono dati crittografati che hanno esattamente le stesse dimensioni dei dati in chiaro. Se si utilizza un algoritmo di crittografia che preserva la lunghezza con codifica a bit rate variabile, un utente malintenzionato può visualizzare la lunghezza di ciascun campione sonoro e lunghezze campionarie e utilizzare le statistiche sul modo in cui le persone parlano per selezionare alcune frasi.

Are they effective? What are their short-comings?

Le statistiche possono essere efficaci in casi speciali. L'ordinamento delle statistiche è che tendono ad essere limitate a speach e plain text che sono una componente più piccola delle comunicazioni oggi di quelle che erano in passato.

    
risposta data 21.09.2011 - 01:32
fonte

Leggi altre domande sui tag