Inizialmente ho iniziato a scrivere una domanda su StackOverflow su un modo intelligente per ottimizzare il mantenimento di una cronologia delle versioni di grandi campi di testo in una tabella di database relazionale , probabilmente usando delta invece di incorrere nel costo di archiviazione di una copia completa del testo modificato in una tabella di controllo su ogni aggiornamento, che viene regolarmente suggerito come il modo più semplice per mantenere la cronologia delle versioni in un database.
Mentre stavo scrivendo, ho iniziato a chiedermi, cosa intendo esattamente per sostenere i costi di archiviazione, davvero?
Ho letto in alcuni punti su Internet che le opere complete di Shakespeare non compresso arrivano in giro 5 Mb , supponendo che sia vero, 1 TB potrebbe contenere approssimativamente 200.000 copie.
Questo è un grande libro, con un sacco di testo. 200.000 sono molte copie di quel libro. Anche un disco rotante da 1 TB non romperebbe esattamente la banca in questi giorni.
Quando parliamo di testo in un database nel 2015, è uno spreco di sforzi per pensare alla compressione, all'ottimizzazione o anche a ridurre deliberatamente gli input, o lo spazio di archiviazione è abbastanza economico ora che non dovrò mai preoccuparmi di colpendo un limite superiore, in pratica, e dovrei invece ottimizzare per il codice app e la semplicità dello schema?