Confronta i nomi e l'uso dell'algoritmo di Levenshtein

0

Ho bisogno di incrociare i nomi di due liste. Qual è la migliore via per confrontare i nomi? Come ci si potrebbe aspettare, in una lista possiamo avere il nome completo, dall'altra solo il primo e l'ultimo.

Oltre a questo, dato che l'elenco viene digitato dall'utente, ci sono sempre differenze tra i nomi, in particolare quelli aziendali.

Finora sto usando l'algoritmo di distanza Levenshtein. C'è un algoritmo migliore? O qualche considerazione che dovrei fare?

public static int Compute(string s, string t)
{
int n = s.Length;
int m = t.Length;
int[,] d = new int[n + 1, m + 1];

// Step 1
if (n == 0)
{
    return m;
}

if (m == 0)
{
    return n;
}

// Step 2
for (int i = 0; i <= n; d[i, 0] = i++)
{
}

for (int j = 0; j <= m; d[0, j] = j++)
{
}

// Step 3
for (int i = 1; i <= n; i++)
{
    //Step 4
    for (int j = 1; j <= m; j++)
    {
    // Step 5
    int cost = (t[j - 1] == s[i - 1]) ? 0 : 1;

    // Step 6
    d[i, j] = Math.Min(
        Math.Min(d[i - 1, j] + 1, d[i, j - 1] + 1),
        d[i - 1, j - 1] + cost);
    }
}
// Step 7
return d[n, m];
}

Finora, la mia preoccupazione principale è la differenza tra il parametro sorgente e il parametro target. La fonte dovrebbe essere il nome più completo o ii non fa differenza?

    
posta cap7 24.04.2015 - 10:44
fonte

0 risposte

Leggi altre domande sui tag