Sto creando un sito web che raccoglierà post dalle pagine di Facebook per mostrare ai post degli utenti a cui sono interessati (come il mio progetto di laurea).
Mi piacerebbe essere in grado di classificare i post che contengono le parole che vengono interrogate. Quindi, io uso ( solr ) per l'indicizzazione del testo completo che mi permette di ottenere in modo effcace i post contenenti le parole che l'utente cerca.
Ora, sto cercando una funzione di posizionamento per restituire prima i risultati di ricerca più pertinenti. Ma ci sono molte variabili che potrebbero influenzare la rilevanza e il posizionamento del post. Ho trovato questi fattori:
-
data del post.
-
Mi piace il numero del post.
-
numero commenti del post (non molto corretto).
-
la pagina pubblicata è stata verificata?
-
i mi piace per la pagina pubblicata.
-
posizione della pagina e dell'utente.
Ho bisogno di una formula per combinare questi fattori e penso che manchi qualcosa: ci deve essere una ponderazione per le parole chiave di ricerca stesse nel post. E forse mi manca qualcosa di più?
C'è un altro modo per determinare la pertinenza?
Alcune informazioni aggiuntive:
- Penso che ci sia un fattore importante che non sto utilizzando. Questo fattore dovrebbe occuparsi delle altre parole chiave nel post e vedere se sono correlate alla parola chiave principale.
Prendi, ad esempio, questi due post:
-
Adoro gli sport.
-
Adoro il basket, il calcio e tutti gli altri sport e penso che siano molto sani.
Diciamo che questi post hanno gli stessi fattori sopra, ma il secondo ha più parole chiave nel dominio richiesto (sport). Come determinare se il secondo post è più correlato al dominio "sport"?