Sto lavorando a un progetto per rendere anonime le PHI nel nostro database dei record sanitari quando i database vengono copiati nei nostri ambienti di test. Attualmente, il database viene copiato e i campi nelle tabelle (nome, cognome, indirizzo, DOB, ecc.) Vengono sostituiti pseudo-casualmente (valore iniziale generato da datetime) con valori da un elenco di valori pre-generato. Per i database di piccole dimensioni va bene, ma quando si utilizzano database di grandi dimensioni con tabelle di grandi dimensioni, i valori vengono ripetuti abbastanza frequentemente e il processo di lavaggio richiede molto tempo. Il mio pensiero era di usare un algoritmo che scambiava i valori nella tabella, ma questo è un modo sicuro per rendere anonimo PHI? Quali tipi di algoritmi genererebbero una varianza sufficiente nei dati mantenendo comunque un tempo di elaborazione ridotto?