I codici postali sono considerati informazioni di identificazione personale?

24

Un sito web pubblico di una società finanziaria (rientra in SEC) ha una mappa HTML 5 degli Stati Uniti in cui ogni punto sulla mappa è il codice postale a 5 cifre dei propri clienti. Questi punti sono generati da un file CSV estratto dal server nel browser in modo che tu possa effettivamente scaricare il file CSV. Il file CSV contiene Città, Zip e Latitudine / Longitudine del codice postale stesso, non l'indirizzo del cliente.

Mi chiedevo, i codici postali da solo sono considerati informazioni di identificazione personale?

    
posta cflyer 31.12.2015 - 19:03
fonte

5 risposte

53

Una volta Netflix prevedeva di organizzare un concorso (per migliorare i consigli sui film) in cui pubblicherebbe la cronologia dei noleggi dei film, le recensioni dei film relative a date di nascita, sesso e codice postale a cinque cifre. Questa combinazione identifica personalmente le informazioni e potrebbe fare cose come l'identità sessuale privata di qualcuno se ciò può essere dedotto dalla loro storia di noleggio.

Un famoso studio ha rilevato che con la data di nascita, sesso e codice postale a cinque cifre è possibile identificare in modo univoco circa 87 % di americani . Ha anche scoperto che è possibile identificare in modo univoco circa 100.000 americani (0,04%) in base alla combinazione di anno di nascita, sesso e codice postale.

Per la deidentificazione medica di informazioni sanitarie protette (PHI), il Il Dipartimento della Salute e dei Servizi Umani degli Stati Uniti suggerisce di troncare le ultime due cifre del codice di avviamento postale a cinque cifre, ad eccezione di 17 avviatori rari di codici postali (dove meno di 20.000 persone condividono queste tre cifre iniziali secondo il censimento degli Stati Uniti) (in particolare 036, 059, 063, 102, 203, 556, 692, 790, 821, 823, 830, 831, 878, 879, 884, 890, 893) nel qual caso è necessario sostituire lo zip codice con tutti gli zeri.

Allo stesso modo, dovresti essere consapevole dei campi come l'età in casi eccezionali sono rari (ad esempio, c'è solo un americano con un'età di 116 anni) quindi HHS consiglia di raggruppare queste età eccezionali in una categoria (ad esempio 90+). Probabilmente è anche meglio raggruppare altri utenti in categorie di età (come 50-55) per aiutare ad anonimizzarli ulteriormente.

    
risposta data 31.12.2015 - 20:42
fonte
15

Di per sé, no. Non è possibile identificare un individuo semplicemente sapendo che le persone codice postale. Il codice postale è semplicemente informazioni demografiche.

Tuttavia, potresti essere in grado di combinare un numero elevato di singoli dati demografici per identificare qualcuno. Zipcode + Age + Sex + Reddito potrebbe facilmente essere sufficiente per identificare qualcuno. Se ti dicessi che la persona A era maschio, 60 anni, viveva nel codice di avviamento postale 98039 e aveva un reddito di 2 miliardi di dollari l'anno scorso, potresti immaginare che stavo parlando di Bill Gates. (Non ho idea di quanto Bill abbia fatto l'anno scorso, ma sto cercando di illustrare un punto).

Il punto è che l'aggregazione di informazioni demografiche individualmente non PII può diventare essa stessa PII.

    
risposta data 31.12.2015 - 19:31
fonte
7

Sì, certo che si tratta di informazioni di identificazione personale. Fornisce informazioni identificative su una persona, quindi perché sulla terra potrebbe essere considerato altrimenti?

Considera un negoziante in una piccola città che dice "Penso che investirò in [compagnia molto impopolare] quando torno a casa stasera." Il suo cliente dice "se lo fai, io non comprerò mai più qui!" Quella notte, il cliente vede che un altro investitore appare sulla mappa della compagnia per quel codice postale.

Ritenete irragionevole che il cliente smetta di fare acquisti in quel negozio? Lo considereresti irragionevole per gli altri, ascoltando questa storia, per smettere anche di fare acquisti lì? Ricorda, piccola città, probabilmente non c'erano più investitori da lì prima.

Ritenete ragionevole che il negoziante faccia causa all'azienda per aver gettato le sue informazioni sugli investimenti privati e quindi causare danni alla sua attività?

Quindi il numero potenziale di codici postali in cui la combinazione di [è un utente del servizio di quel sito web] e [vive in quel codice di avviamento postale] e [quando hanno iniziato a investire] identificherà in modo univoco è ovviamente piuttosto enorme.

Ma è peggio di quello.

I seguenti codici di avviamento postale hanno una popolazione di una sola persona: 05141, 67843, 88264, 98222, 99790. Ci sono oltre un centinaio di codici di avviamento postale con popolazioni inferiori a 10. 11109 ha un'area di appena due blocchi di città. Se vivi a 38639 sei anche nero. Se vivi a 02562 sei bianco (migliore del 99% di probabilità per entrambi). Se vivi a Beverly Hills 90210, sei ricco e tutti lo sanno. Se vivi a 90209, sei ancora ricco, ma probabilmente hai una fica sulla spalla del fatto che il tuo codice postale sia meno famoso.

Ci sono poco meno di 8 miliardi di noi. Ciò significa che abbiamo bisogno solo di "33 bit di entropia", ovvero 33 domande sì / no che dividono la popolazione approssimativamente a metà, come "sei maschio", "vivi al di fuori della Cina / India", ecc. per identificare qualsiasi individuo. Un codice postale fornisce tra 16 bit di informazioni (i due codici postali più popolosi hanno oltre 110.000 persone) e il 33 completo (quei 6 codici postali sopra). Vale a dire, solo un codice postale è almeno la metà delle informazioni necessarie per identificare univocamente nessuno.

[Modifica: e, naturalmente, negli Stati Uniti, le aziende sono persone. Molte, MOLTE aziende con una popolazione tecnica di zero hanno i propri codici di avviamento postale. Se questa società investe in un'altra società, potrebbe NON piacere che tali informazioni vengano pubblicate pubblicamente.]

[Modifica2: i codici postali sono esplicitamente denominati PII dal Massachusetts ( link ) e California ( link

    
risposta data 31.12.2015 - 22:58
fonte
4

Nei Paesi Bassi sia CPB (istituto statale per le statistiche) che CBP (organismo di vigilanza governativa per la privacy sia nel settore commerciale che governativo) concluderanno che il set di dati che hai contiene informazioni personali identificative. Il loro ragionamento sarà il più seguito possibile:

  1. Un codice postale può identificare dire < 100 persone con la corrispondenza più strong e può identificare < 2500 persone con il suffisso rimosso (rimuovendo gli ultimi due caratteri dalle sei posizioni). I primi quattro identificano la regione sulla mappa e gli ultimi due la sottoregione che identificherà anche quale strada è in alcuni casi;
  2. Come si elencano solo i clienti, qualsiasi hit identifica il cliente in quella zona indirettamente a meno che tu non sia il telco con una quota di mercato del 50% in quei codici postali. Se hai 1 su 1000 o anche 100 persone come cliente, puoi identificare quale hit sarà il cliente combinato con alcuni scavi;

Questo può sembrare estremo, ma in un caso di studio per dati medici è stato dimostrato per i Paesi Bassi che le persone potrebbero essere identificate se è stato aggiunto solo un dettaglio extra di terze parti per rendere la relazione con la loro "pseudo data entry" (zip codice basato). In alcune situazioni era solo sfogliare Google Maps per trovare quel dettaglio.

Ma come si indica questo è per un istituto finanziario, quindi devi davvero discuterne con il tuo risk manager. Inoltre, come altri hanno identificato questo come un problema in altri paesi.

    
risposta data 01.01.2016 - 04:17
fonte
3

No, di per sé, un codice postale non è PII. Si tratta di dati demografici, ma dal momento che molte migliaia di persone possono vivere in un unico codice postale, non c'è nulla sul solo codice di avviamento postale che identifica le singole persone che rappresenta. In questo caso, un codice postale può anche rappresentare più client, se ci sono più clienti dell'azienda in un unico codice postale. Quindi, quasi per definizione, non può essere PII, dal momento che non identifica univocamente un singolo individuo.

    
risposta data 31.12.2015 - 19:12
fonte

Leggi altre domande sui tag