Ho un modello matematico con due "stadi" principali 1. caricamento dei dati (solo pochi KB di dati) e 2. esecuzione di un modello sui dati. Voglio implementare alcuni test e controlli per garantire che i dati inseriti nel modello siano validi (tipi corretti, valori corretti, ecc.) Per garantire che l'output del modello sia corretto.
In quale fase dell'intero processo è il momento migliore per implementare questi test, quando carichi i dati o quando esegui il modello sui dati? Oppure i test dovrebbero essere eseguiti in entrambe le fasi?
L'esecuzione dei test solo nella fase di caricamento dei dati riduce l'overhead complessivo e garantisce il corretto output del modello. L'esecuzione di test sulla fase del modello comporta una duplicazione del codice (oltre a un sovraccarico aggiuntivo se i test sono già stati implementati nella fase di caricamento dei dati).
Questo modello verrà eseguito solo una volta alla settimana dagli utenti interni, quindi non ci sono applicazioni esterne o passività / parti dipendenti. Tuttavia, l'oggetto del modello è disponibile all'utente senza dover utilizzare l'oggetto di caricamento dei dati (separato) (quindi, di nuovo, i dati possono, ma non dovrebbero, essere passati al modello dall'utente senza passare attraverso la fase di caricamento dei dati ).
C'è una buona pratica qui? Potrebbe esserci un modo migliore per strutturare il codice per implementare i test?