Domande con tag 'lucene'

1
risposta

In che modo l'apprendimento automatico è incorporato nella progettazione dei motori di ricerca?

Attualmente sto costruendo un piccolo motore di ricerca interno basato su Apache Lucene. Il suo scopo è semplice: basandosi su alcune parole chiave, suggerirà alcuni articoli scritti internamente all'interno della nostra azienda. Sto usando un p...
posta 27.11.2013 - 18:09
1
risposta

Quanto è importante la dimensione dell'indice durante la ricerca?

La mia azienda ha recentemente iniziato a utilizzare Apache Solr per cercare i suoi dati. Man mano che impariamo a usarlo, abbiamo percorso il percorso dell'indicizzazione di più campi per ottenere i risultati di cui abbiamo bisogno. Molti di...
posta 27.03.2012 - 16:28
1
risposta

Buona tecnica per la tokenizzazione del testo di ricerca

Stiamo cercando un modo per tokenizzare del testo nello stesso modo in cui lo farebbe un motore di ricerca. Il motivo per cui stiamo facendo questo è che possiamo eseguire alcune analisi statistiche sui token. Il linguaggio che stiamo usando...
posta 15.11.2012 - 19:41
2
risposte

Ricerca testuale: problema con i big data

Ho un problema che speravo di poter ottenere un consiglio! Ho un sacco di testo come input (circa 20 GB di valore, non MASSIVE ma abbastanza grande). Questo è solo testo libero, non strutturato. Ho un 'elenco di categorie'. Voglio elaborar...
posta 05.07.2013 - 18:54
3
risposte

NLP - Query che utilizzano caratteri jolly semantici nella ricerca a testo integrale, forse con Lucene?

Diciamo che ho un corpus grande (per esempio in inglese o una lingua arbitraria), e voglio fare qualche ricerca semantica su di esso. Ad esempio, ho la query: "Fai attenzione: [art] l'armada di [sg] sta arrivando a [do sg]!" E il corpus co...
posta 26.11.2012 - 00:56
0
risposte

Incorporando l'algoritmo personalizzato in SOLR-LUCENE, prima dell'indicizzazione?

FLUSSO ATTUALE: sto utilizzando un algoritmo personalizzato (attualmente in php) per classificare i record MYSQL prima di INDICARE su SOLR. CHE COSA VOGLIO: È possibile implementarlo ALGORITHM (potrebbe trovarsi in JAVA) all'interno della...
posta 05.11.2014 - 14:16
2
risposte

Lucene + Join == RDBMS?

Ora che Lucene supporta i join (al momento dell'indicizzazione e al tempo di interrogazione) si può usare Lucene come database (uno NoSQL, con coerenza finale)? Nota: stavo riflettendo su questo per un po 'e questa è un'idea che viene di tant...
posta 02.10.2013 - 22:37
1
risposta

È lucene.net/solrnet una buona soluzione per cercare un elenco di nomi con corrispondenza fuzzy? [chiuso]

Al momento, stiamo utilizzando la ricerca full text del server sql, ma è troppo rigida. La cosa principale che facciamo è cercare i nomi delle persone da un database basato su una query di ricerca. Le ricerche devono essere veloci e devono es...
posta 19.12.2013 - 15:32
2
risposte

Creazione di un'applicazione Web con ricerca full text su dati dinamici

Anche dopo un'approfondita ingegnerizzazione dei requisiti ci ritroviamo con utenti che vogliono allegare "note" ai loro record di dati altrimenti ben strutturati, in altre parole: coppie di valori-chiave arbitrari. Il loro principale interesse...
posta 11.05.2016 - 13:47
3
risposte

Strategia per aggiornare l'indice di ricerca dopo aver corretto la generazione dell'indice

Descrizione della situazione Sto lavorando a un'applicazione (basata su Spring Framework) utilizzando un indice di ricerca (lucene se ciò è importante) per rendere ricercabile il contenuto di tale applicazione. I documenti vengono aggiunti /...
posta 04.08.2017 - 15:14