cos'è la privacy differenziale?

11

Al momento ho sentito molto sulla privacy differenziale, ma non sono in grado di scoprire che cosa sia esattamente in una lingua non matematica. Finora la mia comprensione è che aggiunge rumore alla risposta che si ottiene per la sua interrogazione al database.

    
posta Geek 31.01.2014 - 20:35
fonte

1 risposta

12

La pagina di Wikipedia ha una matematica ma anche un esempio che può o non può essere illuminante: se puoi chiedere un database per la somma dei valori di una colonna per le righe 1 a n , quindi facendo la richiesta per n-1 e per n consente di ricostruire le informazioni sulla riga n . Pertanto, consentendo l'interrogazione "somma di tutti i valori per le prime n righe" e restituendo il risultato esatto può essere abusato nell'apprendimento delle informazioni esatte per ogni riga.

Privacy differenziale è il concetto matematico con cui viene misurato quanto (o quanto poco) un database preserva l'anonimato (ad esempio evita problemi come quello sopra). L'aggiunta di rumore casuale è un metodo per raggiungere (si spera) un dato livello di privacy differenziale. Questo non è l'unico metodo possibile, ma almeno è relativamente semplice da implementare, e possiamo calcolare quanto protegge l'anonimato, cioè, nel formalismo matematico, qual è il valore ottenuto di "ε" nell'espressione "il database garantisce la privacy ε-differenziale ".

L'aggiunta di rumore è un compromesso: fornisce una qualche privacy a scapito dell'usabilità, poiché i valori restituiti sono "rumorosi", quindi imprecisi. Se vuoi più privacy devi degradare la qualità delle risposte del database. La ricerca sulla privacy differenziale si concentra sulla ricerca di nuovi algoritmi per restituire risposte più accurate alle query statistiche, proteggendo al contempo meglio la privacy. Tali nuovi algoritmi sono pesanti in matematica.

    
risposta data 31.01.2014 - 22:41
fonte

Leggi altre domande sui tag