Come specificare i criteri di accettazione per la casualità?

Question

Come specificare i criteri di accettazione per la casualità?

#1 da (6 voti)

3

Come potrei esprimere un criterio / storia / scenario di accettazione Behavior Driven Development (BDD) che indica che gli elementi dovrebbero essere casuali in una certa misura su una schermata Home di un'app come Instagram?

Ecco cosa ho pensato finora:

Scenario: Random images appear in Home screen

Given 1000 images
And each view of the Home screen shows 10 random images
And the user has viewed the Home screen 99 times
When the user views the Home screen for the 100th time
Then no image should have appeared on the Home screen more than 25 times

Dal punto di vista dell'utente, questo sembra un buon modo per esprimere il requisito. Tuttavia, se eseguo questo test in un framework BDD come parte di Continuous Integration (CI), allora c'è qualche possibilità che non passi una volta ogni tanto.

Quindi, ci sono dei modi migliori per specificare un criterio di accettazione per la casualità che fallirà solo se c'è un bug nel codice e non a causa della casualità stessa?

bdd random acceptance-testing

posta Michael Osofsky 28.01.2015 - 04:42

fonte

1 risposta

Leggi altre domande sui tag bdd random acceptance-testing

È meglio una serie di OR o una singola istruzione IN IN SQL? Come si mantiene il protocollo del valore di ritorno della funzione nel linguaggio dinamico?

score 6 · Accepted Answer

Con algoritmi randomizzati in un ambiente CI è della massima importanza che il risultato del test sia il più non casuale possibile. Devi in ogni caso trovare un modo per garantire che un'implementazione corretta quasi sempre porti ad un test superato. In caso contrario, tu o i tuoi colleghi sarete costretti a disabilitare il test e pianificate di riscriverlo. Non è possibile bloccare l'intero downstream a causa di un errore casuale del test. Inoltre, non è accettabile dover ricostruire "perché a volte semplicemente non funziona".

Pertanto, è possibile e non si devono scrivere test che coinvolgono un algoritmo con un risultato casuale, ma provare a verificare un risultato concreto. Come ha sottolineato Robert Harvey, l'unico modo significativo per affrontare la qualità di una distribuzione casuale è analizzarlo in modo matematico / statistico. Per quanto in profondità tu entri in quella tana del coniglio, è una questione di preferenze personali e l'importanza e la precisione richiesta dell'unità sottoposta a test.

Potresti provare a misurare valori come deviazioni standard se il tuo campione è abbastanza grande. Si potrebbe anche optare per un approccio più pratico, ad esempio, assicurandosi che un certo numero di immagini diverse venga visualizzato all'interno delle viste X. Per quanto riguarda quest'ultimo, è comunque necessario tenere presente che è necessario formulare un criterio, per il quale la probabilità che venga violato da un'implementazione corretta a causa di una variazione casuale è estremamente ridotta. Preferibilmente, dovrebbe essere inferiore alla probabilità che l'hardware del server CI non funzioni correttamente.

Quando scrivi i test effettivi, ci sono in genere due cose da tenere a mente con casualità:

Seed. Come già detto da Robert Harvey, puoi rendere la vita più facile a te stesso quando sai quale seme ha causato il fallimento. La casualità è davvero difficile da "riprodurre" altrimenti. Non consiglio comunque di usare un seme fisso. Dovresti prendere un seme fresco per ogni ciclo, perché vuoi che il tuo algoritmo sia testato da CI su un sacco di valori diversi nel tempo. Ma dovresti fare attenzione, che i messaggi di fallimento del test contengano qualsiasi seme utilizzato.
Prestazioni. Se stai scrivendo i test BDD per i criteri di accettazione, potrebbe non essere un grosso problema. Se includi tali test all'interno dei test unitari, sarà molto più lento rispetto ad altri test a causa delle ripetute corse richieste. Alcuni libri sostengono che un test unitario dovrebbe essere più veloce di 10 ms. Questo è praticamente impossibile se si tenta di eseguire un algoritmo randomizzato 1000 volte. 10 ms possono sembrare estremi, ma una volta che si desidera eseguire centinaia di migliaia di questi test, questo si riassume rapidamente, ancor più quando sono necessarie ripetute esecuzioni.