Confronta SSIS e MDS / DQS

0

In che modo Master Data Services e Data Quality Services si adattano allo stack BI esistente?

In SSIS è presente un componente Fuzzy Lookup e Fuzzy Grouping. Quindi sto cercando di confrontare: SSIS v MDS / DQS.

Da quanto ho capito MDS / DQS è la soluzione preferita se si stanno elaborando i record su una transazione per transazione, ad es. utenti finali che aggiornano i singoli record. SSIS è la soluzione preferita se si elaborano i record come batch, ovvero l'elaborazione in batch. È corretto?

    
posta w0051977 26.05.2015 - 12:11
fonte

1 risposta

1

Tutti e tre questi strumenti hanno funzionalità molto diverse.

SSIS è uno strumento ETL (es. Estrai, Trasforma, Carica). Sì, è per l'elaborazione batch di dati e anche per l'elaborazione parallela di più flussi di dati. Nel caso della BI, il suo lavoro principale è la popolazione di varie tabelle di data warehouse. Quelli potrebbero essere tabelle di gestione temporanea o potrebbero essere le tabelle di magazzino effettive. Può anche essere utilizzato in molte situazioni non BI in cui i dati devono essere trasformati e spostati. I componenti Fuzzy Lookup e Fuzzy Grouping pre-data MDS e DQS, e sono abbastanza limitati, ma potenzialmente ancora utili in alcuni scenari o se non si intende adottare DQS.

MDS è uno strumento di integrazione dei dati. L'intenzione è di utilizzarlo in situazioni in cui un'organizzazione dispone di più database transazionali con dati sovrapposti e occorre integrare tali dati e integrarli. Ciò significa impostare le regole per determinare come abbinare i dati dai diversi sistemi. Può anche essere utilizzato per trasferire i dati centralizzati a sistemi transazionali per risolvere casi in cui i dati erano diversi nei diversi sistemi. È un tentativo di ottenere "una versione della verità" in un luogo centralizzato o attraverso tutti i sistemi.

DQS è uno strumento per la qualità dei dati. Fornisce funzionalità che consentono agli sviluppatori e agli amministratori di dati di collaborare all'impostazione di regole per risolvere i problemi di qualità dei dati. Mentre queste regole potrebbero aiutare con problemi di integrazione dei dati, DQS non si limita a pulire quelle colonne che vengono utilizzate per abbinare i set di dati. Le regole possono essere impostate per sostituire i valori in una determinata colonna con un altro valore, ad esempio, quindi forse c'è un errore di immissione dati comune che viene effettuato in un sistema. Quando si nota il problema, è possibile impostare una regola per sostituire sempre quella particolare stringa con un'altra stringa.

SSIS può essere utilizzato con MDS e DQS, nei casi in cui è necessaria la funzionalità di più di uno di essi. Ecco un tutorial Microsoft che illustra come possono essere utilizzati l'uno accanto all'altro.

Naturalmente, potresti optare per implementare tu stesso le funzionalità dei dati master - non è un nuovo concetto, MDS è solo l'offerta semi-automatica di dati master di Microsoft. Per molte organizzazioni, il data warehouse (o almeno un livello di esso) è l'archivio dei dati anagrafici. Allo stesso modo, DQS è solo uno strumento per la qualità dei dati, ma potresti decidere di impostare i tuoi processi di qualità dei dati. Se stai usando lo stack Microsoft, più lo fai da solo, più probabilmente finirai per usare SSIS.

    
risposta data 12.06.2015 - 22:19
fonte

Leggi altre domande sui tag