Sono nuovo nella codifica e non so come si chiama ciò che sto cercando di fare, e voglio scoprirlo in modo da poter fare più ricerche e non reinventare la ruota. Ho cercato cose come data consolidation/combine input
ma i risultati sono troppo vaghi o se aggiungo il nome di una lingua ottengo librerie irrilevanti (ad esempio javascript: questo o questo )
Quello che sto cercando di fare è consolidare i dati da fonti diverse:
- Ho diverse fonti di dati di cose (diciamo organizzazioni)
- Sto cercando di consolidare quelle fonti in modo da avere 1 rappresentazione unica di ciascuna cosa
- Le origini potrebbero avere valori diversi per ogni cosa (ad es. sourceA
potrebbe avere il nome dell'organizzazione come "My Funny App" e sourceB
potrebbe avere "MyFunny")
- Quindi ho bisogno di un po 'di logica per consolidare i dati (cioè quale fonte mantenere?)
Non sto chiedendo le regole di consolidamento poiché capisco che questo è veramente caso d'uso specifico e parte di esso può essere fatto attraverso normalization
(i valori normalizzati hanno maggiori probabilità di combaciare, meno conflitti tuttavia, penso che chiunque svolga questo tipo di lavoro dovrebbe eseguire alcune attività comuni :
ASSEGNAZIONE DEI VALORI:
- aggiungi valori mancanti
- per valori in conflitto / esistenti, provare a risolvere
- risolvere in base ad alcuni criteri che definiscono un punteggio per ciascun valore
- scegli il valore con il punteggio più alto
Debug:
- Tieni traccia di tutti i valori (originale / normalizzato) e le loro fonti / punteggi
- avere log che mostra come ogni cosa viene modificata mentre passa attraverso ciascuna fonte
Ciò che sto cercando di fare ha un nome specifico? I loro modelli di progettazione sono in grado di farlo in modo più efficiente?