Stiamo progettando un algoritmo di differenziazione (basato su Longest Common Subsequence) che confronta un testo sorgente e una copia modificata per estrarre il nuovo contenuto (cioè il contenuto che è solo nella copia modificata). Attualmente sto compilando una libreria di dati del test case.
Dobbiamo essere in grado di eseguire test automatici che verificano i casi di test, ma non vogliamo verificarne la precisione. Data la natura euristica del nostro algoritmo, abbiamo bisogno che il nostro test pass / failures sia sfocato. Vogliamo specificare una soglia di sovrapposizione tra il risultato desiderato e il risultato effettivo (cioè il contenuto che viene estratto).
Ho alcuni schizzi nella mia mente su come risolvere questo problema, ma qualcuno ha già fatto questo? Qualcuno ha una guida o idee su come farlo in modo efficace?