Contesto:
Ho dati storici sulle vendite di proprietà (casa) raccolte da varie fonti in un'origine dati centralizzata / cloud (supponiamo che la raccolta delle informazioni sia gestita da una terza parte)
Pianificazione dello sviluppo di un'applicazione per eseguire query e recuperare dati da questa origine dati centralizzata
Query di esempio:
Semplice : per un determinato codice postale XYZ, qual è il prezzo medio di una casa a 3 letti?
Complesso : qual è il prezzo stimato per una casa in "DD, Some Street, XYZ Post Code" (elaborato dai valori medi dei dati storici filtrati dalle varie caratteristiche della casa: codice postale di casa , no di camere da letto, area totale e altre intuizioni più profonde come tipo di edificio, anno di costruzione, caratteristiche)?
Oltre al prezzo medio, l'applicazione deve supportare altre informazioni sulla proprietà ** massimo, o prezzo minimo..etc e tendenza (grafico) su un attributo di proprietà selezionato per un periodo di tempo **. Quindi, le query non dovrebbero imporre la ricerca basata su una chiave primaria o su alcuni campi fissi
In altre parole, le query possono essere
Qual è il cambiamento del prezzo di una casa a 3 letti (indipendentemente dalla posizione) negli ultimi 30 giorni?
Che tipo di proprietà possiamo ottenere per il prezzo X (indipendentemente dalla località o dal tipo di casa)
La sfida che ho è identificare il dominio (BI / Data Analytical o DB Design o DB Query Interface o DW correlata o qualcos'altro) a cui appartiene questo problema (query dinamica su dati storici), così posso fare ulteriori esplorazioni
I miei risultati fino ad ora
Potrei sbagliarmi su quanto segue, quindi correggimi se la pensi così
Ho letto brevemente su BI / Data Analytics: penso che sia una soluzione pesante per il mio problema e abbia problemi di scalabilità.
Progettazione DB - Come ho capito RDBMS funziona bene se conosci il modello Data in fase di progettazione. Mi aspetto che gli attributi riguardanti la proprietà o l'altra entità (utente) che sto per introdurre, si evolvano rapidamente. quindi la manutenzione sarebbe un problema. Poiché avrò più utenti che eseguono query contemporaneamente, le prestazioni sarebbero un collo di bottiglia
Altre opzioni come il DB grafico ( link ) sembrano essere un po 'complesse (sono buone, ma usano quegli strumenti pensati per scopi generici , fammi pensare come programmazione di assiemi per risolvere il mio problema)
La soluzione correlata a BigData consiste nell'analizzare i dati da più domini non collegati
Quindi, Qualche suggerimento sullo spazio in cui si inserisce questo problema? (Specialmente se hai esperienza di progettazione / implementazione di back-end per l'elenco di proprietà o portali simili)