Sto configurando un processo ETL e un piccolo data warehouse per interrogare i dati in poche dimensioni diverse. Un problema è che lo schema degli oggetti può mutare nel tempo, principalmente che alcuni campi verranno aggiunti e alcuni rimossi. Quali sono alcune metodologie o approcci per gestirlo?
(Si noti che i dati di origine sono gestiti come EAV, che è difficile da interrogare ed è lento, quindi l'approccio DW in primo luogo).
Ciò che sembra un approccio ingenuo (che spesso può essere il migliore) è semplicemente aggiungere colonne nel tempo alle forme di destinazione nel magazzino e recuperare gli oggetti esistenti con alcuni dati segnaposto validi per le query.
Questo è un po 'fuori dalla mia esperienza di dominio, quindi, cercando input.