Abbiamo un repository di tabelle. Circa 200 tabelle, ciascuna tabella può essere composta da migliaia di righe, tutte le tabelle sono originariamente in fogli Excel.
Ogni tabella ha uno schema diverso. Tutti i dati sono di testo o numeri.
Vogliamo creare un'applicazione che consenta la ricerca di testo libero su tutte le tabelle (definiamo quali colonne verranno cercate in ogni tabella) in modo efficiente - la velocità è importante.
Il dilemma principale è quale tecnologia DB dovremmo scegliere.
Abbiamo creato un modello importando tutte le tabelle su MS SQL Server e creando un indice di testo completo su di esse. La ricerca viene eseguita utilizzando la parola chiave CONTAINS. Questa soluzione funziona bene per un numero limitato di tabelle, ma non scala.
Abbiamo pensato a una soluzione NoSQL, ma non ne abbiamo ancora esperienza.
I nostri limiti (che purtroppo non posso effettuare): solo i server Windows. Ma possiamo installare su di loro quello che vogliamo.