Ho un ampio database di clienti. È necessario identificare i clienti con due o più ID cliente.
Questo deriva principalmente dalle persone alla reception che creano nuovi clienti invece di cercare i loro ID esistenti o eseguire una cattiva acquisizione dei dati, quindi finiamo per avere questo genere di cose:
ID name surname birthday
------------------------------------------------
14 Juan Vazquez 1955-01-20
78 Juan Vasquez 1980-06-12
85 Juan Vazquez 1980-06-12
Gli ID 78 e 85 appartengono quasi sicuramente alla stessa persona (si noti lo stesso compleanno ma una leggera differenza nel cognome)
L'ID 14 è sicuramente un'altra persona a causa di una grande differenza nei compleanni relativi ai record simili
Quindi possiamo assegnare equivalenze:
MainID EquivalentID
------------------------
78 85
Quale soluzione puoi consigliare di identificare record simili basati su regole ?