Come parte della convalida, eseguiamo il controllo della similarità del nome e consentiamo solo se viene raggiunta la soglia. Ho ricevuto aiuto da StackOverflow riguardante l'implementazione e infine implementato l'algoritmo JaroWinkler . Recentemente abbiamo osservato che non è affidabile per i nomi lunghi e alcuni nomi falsi superano anche la soglia.
So che l'algoritmo è per misurare la distanza di modifica tra due sequenze. C'è un modo migliore per risolvere questo problema?
Semplicemente curioso di sapere come fanno le istituzioni finanziarie a convalidare questo nome.
[EDIT]:
Ho ottenuto risultati migliori con questo approccio.
- dividere il nome per ottenere FN, MD, LN.
- usa l'algoritmo Levenshtein per calcolare la corrispondenza%. (Implementato l'algoritmo per soddisfare i requisiti).
- calcola la% del nome piccolo e restituisci la media della corrispondenza percentuale.
Questa implementazione dell'algoritmo ha rimosso in modo significativo gli errori che avevo usato con Jaro-Winkler.