Chiede i totali di controllo su un file un mezzo obsoleto per verificare un file?

6

Sono in una nuova posizione in cui ho bisogno di elaborare un file flat su base regolare. L'ultima volta che l'ho fatto è stato 5 o 6 anni fa ma, come parte del layout del file, ho ricevuto i totali di controllo. Mi ha dato informazioni semplicistiche sul file come il numero totale di record e somme dei campi importanti. Questo mi ha aiutato durante i test, anche durante la produzione, per verificare che il file sia arrivato e abbia informazioni corrette.

Ho richiesto dati simili per questo nuovo progetto e ho colpito un muro di no.

Non è più una pratica standard?

C'è un modo migliore?

    
posta CTKeane 18.12.2012 - 19:16
fonte

1 risposta

8

Dipende da cosa stai provando a testare.

Se stai cercando di verificare che un file sia arrivato integro e non sia stato modificato durante il trasporto, un checksum (o una firma digitale) sarebbe il gold standard.

Se stai cercando di verificare che il file sia stato elaborato correttamente, le informazioni aggregate che stai cercando sono eccezionalmente utili. Sfortunatamente, una grande parte dei processi ETL basati su file flat sono costruiti con una scarsa attenzione alla gestione e alla prevenzione degli errori, quindi non è mai stato richiesto a molte sorgenti di dati di fornire questo tipo di informazioni di intestazione, non avere il codice per farlo, e non sono molto interessati a scrivere il codice dalla loro parte per generare i totali se pochi dei loro clienti hanno interesse a usarlo.

Ciò che stai chiedendo sembra assolutamente ragionevole. Se stai ricevendo il pushback dalla fonte dei dati, nel contesto di ciò che è politicamente fattibile nel tuo ambiente, aumenterei il problema. Presumibilmente, se l'origine dati è interna, hai molto più effetto leva se stai richiedendo un feed di dati da un fornitore esterno.

    
risposta data 18.12.2012 - 19:25
fonte

Leggi altre domande sui tag