Spero che non chiuderai la domanda. Anche se non ci sono computer coinvolti, si tratta ancora di informazioni e sicurezza, e penso che gli esperti di sicurezza siano quelli che saranno in grado di aiutare meglio.
Voglio fare qualche ricerca utente. Ho bisogno che le persone compilino un questionario e poi compilino un altro questionario due mesi dopo. Devo garantire loro l'anonimato, ma sarà comunque molto buono se riesco a far corrispondere le risposte di una persona dal turno A alle risposte della stessa persona del turno B.
Anche se questo viene fatto online, non penso di poter lasciare che un sistema informatico scopra qualcosa su di loro in modo che possa fare l'abbinamento per me. In teoria, potrei chiedere loro un nome e memorizzare il suo hash MD5. In pratica, se dico ai partecipanti che saranno anonimi e poi chiederanno un nome, perderò la loro fiducia. E l'inizio di un questionario non è un buon posto per educare le persone a caso su cosa sia MD5. Ma per renderlo ancora più difficile, penso che farò il mio prossimo sondaggio usando carta e penna, per ragioni logistiche.
Se ho iniziato a distribuire i token della gente, penso che li perderanno durante i due mesi. Quindi la soluzione migliore che riesco a pensare è una sorta di hash manuale. Ad esempio, potrei chiedere loro "per favore riempia la seconda e la quinta lettera del tuo cognome e il giorno del mese in cui sei nato". Quindi la mia domanda è, come faccio a trovare una buona funzione di questo tipo?
- quali dati possono essere utilizzati su una persona? Devono essere garantiti per esistere (il mio esempio precedente si rompe se la persona ha un cognome di quattro lettere), altamente individuale (ma non al 100% unico), e la persona deve conoscerli senza doverli cercare da qualche parte.
- C'è un modo conveniente per calcolare quante cifre / lettere devo chiedere per garantire una probabilità di collisione inferiore al X% in un gruppo di persone Y?
- Alcuni dei dati possibili sono più problematici di altri? Ad esempio, potrebbe essere che le persone sarebbero più riluttanti a scrivere la prima lettera del loro cognome rispetto al secondo, perché pensano che sarebbe facile per qualcuno cercare di cercarli in un "attacco di forza bruta" e scoprire chi sono?
- Come faccio a scoprire il massimo livello di complessità oltre il quale le persone non giocano o iniziano a commettere errori?