Se devi lavorare su grandi set di dati, devi imparare come gestirli in modo efficiente.
Pensa solo se stai per fare l'analisi delle immagini su un'immagine TIFF da 2 Gb. O sequenza di corrispondenza su un dataset del genoma da 150 Gb.
Quando ti sposti da "niente è lento" a "questa operazione è veloce e QUESTO è molto, molto lento ma QUESTE operazioni sono veloci", i tuoi algoritmi tendono a cambiare. È relativamente economico manipolare i dati in memoria anziché doverli prelevare dal disco tutto il tempo, ed è relativamente economico manipolare i dati nella cache della CPU anziché doverli prelevare dalla memoria tutto il tempo. In altre parole, gli algoritmi che prendono in considerazione saranno più veloci con risultati più rapidi, più pubblicazioni e premi Nobel e fama.