Che cosa significa "copertura dei dati" quando si parla di processi ETL?

1

Stavo guardando questo parlare delle carenze di ETL e le soluzioni fornite dalla piattaforma Kafka ma non lo faccio capisco a cosa si riferisce l'oratore quando dice

ETL tools have been around for a decade, yet data coverage in warehouses is still low.

Che cosa significa "copertura dati" in questo scenario? Sta cercando di dire che non tutti i dati dai database vengono infine trasferiti nei data warehouse?

    
posta Indaco789 01.05.2018 - 14:50
fonte

1 risposta

1

Sì, è così che lo interpreto. I dati memorizzati nei data warehouse sono importati da fonti primarie. Lo sforzo richiesto per introdurre i dati non è banale, quindi molti dei dati di origine non sono disponibili nel data warehouse. In genere, questo significa che potresti avere ogni indirizzo di ogni cliente, ma ad esempio non hai date di nascita. Non è che ti manchino pezzi di dati nell'ambito di ciò che viene modellato. Questo più o meno nega il valore del magazzino.

    
risposta data 01.05.2018 - 15:32
fonte

Leggi altre domande sui tag