"only that the resulting DB matches what is expected"
Quindi è necessario prendere alcuni set fissi di dati di test, eseguire il processo ETL e confrontare il contenuto del DB risultante con una serie di dati di riferimento. Questo è tutto. I set di dati di test dovrebbero essere abbastanza piccoli da consentire di verificare il risultato in un ragionevole lasso di tempo e abbastanza complessi da coprire tutti i passaggi importanti del processo ETL.
Il modo in cui fai il confronto tecnicamente dipende da te, dipende dallo specifico sistema di database, dalla disponibilità e dalle dimensioni dei dati di riferimento, dalle dimensioni complessive e dalla complessità del tuo sistema, dagli strumenti che hai a portata di mano per dare un significato confronto, i tuoi limiti di tempo, il livello richiesto di dettaglio del confronto, il tuo livello di abilità personale e così via. Non esiste una soluzione "taglia unica" per questo, è necessario trovare ciò che si adatta meglio alle tue esigenze e personalizzare il tuo ambiente per questo.