Vogliamo un grande accesso ai dati sensibili (si pensi alle cartelle cliniche) in 10 ospedali, in modo che possano studiare i modelli. Dovrebbero essere in grado di tagliare i record usando i filtri nel nostro software per rivelare cose come "100 complicazioni più comuni sono (Complication_Type: count) o fare un istogramma di giorni rimasti in ospedale per una data diagnosi. incollare "top 100 fattori ..." in PPT o PDF comodi, ma non dovrebbero essere in grado di salvare solo tutti i record. Allo stesso tempo, non vogliamo che un datore di lavoro insoddisfatto esca con 10.000 di record e rilasci i dati in Questo è un programma Java, quindi possiamo mettere a punto ciò che gli utenti possono e non possono fare. Abbiamo elaborato queste strategie di mitigazione:
(1) Sostituisci i nomi attuali con gli ID, ma non sarà sufficiente. Si possono derivare identità per date di visita ospedaliera.
(2) Non consente di copiare / stampare più di 100 righe di chiave: coppie di valori per copia.
(3) Contare il numero di singoli record scaricati e generare un download di flag / blocco se supera il limite.
Quali strategie possiamo utilizzare per rendere più difficile agli analisti solo salvare grandi quantità di dati grezzi?
Questo non è un "come affrontare gli hacker, rubare informazioni a volontà". Piuttosto "Come evitare una situazione in cui 1000 analisti dispongono di un archivio completo di cartelle cliniche e uno di questi archivi diventa pubblico.