Crea associazione tra le informazioni

1

Ho implementato un progetto alcuni giorni fa che consente di estrarre alcuni articoli medici utilizzando i risultati di un questionario compilato da un utente. Per esempio, se rispondo sul questionario sono affetto da diabete di tipo 2 e sono un fumatore, il mio algoritmo estrae tutti gli articoli relativi al diabete che ribollono tutti gli articoli che contengono informazioni sul diabete di tipo 2 e sul fumo. Fondamentalmente abbiamo creato un elenco di argomenti e, per ogni argomento, definiamo una sorta di "linea guida" che consente di estrarre e ordinare informazioni per un utente.

Sono abbastanza sicuro che ci sia un modo migliore per mettere in relazione due contenuti, ma non sono stato in grado di trovarli sulla rete. Potresti suggerire il mio modello, algoritmo o carta per capire meglio questo tipo di problema e questo mi aiuta a trovare un modo più rapido e più accurato per estrarre informazioni per un utente?

    
posta Andrea Girardi 28.09.2012 - 10:14
fonte

1 risposta

1

Questa è un'applicazione perfetta per un indicizzatore full-text come Lucene .

Diciamo che il tuo questionario chiede tre cose: fumo, diabete e obesità. Una volta indicizzato il testo degli articoli, puoi utilizzare le risposte che ottieni per formare le query che restituiranno per primi gli articoli più pertinenti.

Quindi, ad esempio, la query per un fumatore sovrappeso non diabetico potrebbe essere:

  • obesity smoking
  • +obesity +smoking per restituire solo articoli che menzionano esplicitamente entrambi
  • +obesity +smoking -diabetes per assicurarsi che gli articoli selezionati menzionino entrambi e non menzioni il diabete

I risultati possono essere ulteriormente migliorati utilizzando un expander di query come WordNet che può aggiungere sinonimi alla query (ad es. espandendo diabetes per includere parole correlate come neuropathy , retinopathy e insulin ) e creare articoli contenenti quelle parole più rilevanti.

Ho costruito diversi sistemi che hanno messo in uso in modo inusuale gli indicizzatori full-text e hanno scoperto che offrono molta flessibilità di query con un minimo di sviluppo e danno ottimi risultati.

    
risposta data 28.09.2012 - 13:06
fonte