Come faccio a prendere in giro una grande fonte di dati?

2

Sto sviluppando una soluzione ML / AI e sto cercando di scrivere alcuni test unitari.

Finisco con oggetti di grandi dimensioni con molti dati. Questi provengono da un'origine dati che è costruita in fase di runtime. I dati creati come una composizione di informazioni recuperate direttamente da un'API - Ho deriso quella risposta in un risultato più semplice, ma affinché ogni test sia significativo, è necessario includere il set di dati completo.

Come faccio a prendere in giro la risultante fonte di dati che si idrata ? Devo creare una classe con dati statici? Non sembra giusto, sarebbe enorme, e dovrei farlo molto manualmente. Ho dati di esempio, ma dovrei comunque idratarlo in fase di esecuzione.

Quale è un modo migliore per farlo?

    
posta Ares 18.07.2017 - 15:24
fonte

1 risposta

3

Se si legge un insieme di regole di test unitarie, si dice che:

  • Un test unitario non è un test unitario se tocca il file system

Quindi, l'opzione 1 è file di codice / classe che hanno questi dati. Tuttavia, questi saranno grandi e ingombranti.

In questo caso, è OK piegare leggermente le regole. Basta creare una directory nel codice sorgente che contiene i dati di test (file). Assicurarsi che i file vengano copiati nella directory di output durante la compilazione ed eseguire i test. Questo sarà più facile da gestire.

Come passaggio post test, è possibile copiare l'intero output in un'area "packaging" e omettere i file di test e / o la directory. In questo modo non vengono distribuiti.

    
risposta data 18.07.2017 - 16:58
fonte

Leggi altre domande sui tag