Il problema che voglio risolvere è il seguente:
Dato un insieme di utenti, ciascuno con una serie di interessi che possono specificare autonomamente, trovare tutte le coppie di utenti che condividono gli stessi interessi con una soglia di somiglianza (ad esempio il 50% di interessi simili). Inoltre alcune categorie di interessi dovrebbero avere un peso maggiore di altre (cioè essere più importanti verso la soglia).
Attualmente, posso solo pensare a modelli relazionali per risolvere questo problema, ma ci si sente in errore e qualcosa che richiederà troppo tempo per essere elaborato una volta che ci sono almeno 100 utenti. Con la mia attuale conoscenza dei DB basati su documenti (ad es. Mongo) ritengo che non siano un'opzione, poiché dovremmo sempre ricorrere ai documenti di riferimento incrociato (?). Dovrei fare più letture su DB basati su grafici? Qualsiasi suggerimento è benvenuto.
Sto cercando una soluzione equilibrata in termini di complessità e prestazioni. Non sto cercando qualcosa che funzioni con milioni di utenti se questo significa che devo leggere un sacco di documenti di ricerca, ma un approccio che supporterà poche migliaia di utenti sarà sufficiente.