Come combinare le parole di ricerca? AND o OR?

2

Ho una ricerca di base nella mia pagina web. Quando l'ho progettato, ho scelto di combinare gli input della casella di ricerca con OR. Ad esempio: una ricerca di foo bar verrà convertita in foo OR bar , quindi verrà visualizzata ogni voce che include foo o barra.

L'ho fatto perché pensavo che una ricerca dovrebbe tornare il più possibile e lasciare all'utente la ricerca con AND (una ricerca per foo and bar restituirà solo le voci che contengono entrambe).

Quando il cliente lo ha testato, ha provato a cercare "foo bar" e non è riuscito a trovare la voce giusta perché la ricerca è tornata molto. Sembra confondersi con lui che una ricerca di foo bar potrebbe restituire voci in cui uno degli input di ricerca è incluso e non entrambi.

Qual è il modo migliore per combinare le parole di ricerca (quando l'utente non fornisce alcuna informazione di combinazione)? Dovrei usare foo AND bar o foo OR bar ?

    
posta Jan Hommes 30.08.2013 - 09:19
fonte

3 risposte

10

Questa è una domanda di usabilità (per UX.SE ). Idealmente, dovresti

  • prima produce i risultati più pertinenti (quelli con la frase esatta inserita),
  • quindi i risultati con le parole chiave di ricerca (e le loro inflessioni ) adiacenti tra loro,
  • quindi i risultati per l'operazione AND sulla ricerca per singole parole chiave / le relative inflessioni (ad esempio ovunque nel documento),
  • e infine risultati con OR (ordinati in ordine decrescente da qualsiasi tipo di punteggio di pertinenza in una ricerca per singole parole chiave, le loro inflessioni e, possibilmente, sinonimi).

Non andrei troppo lontano però: la cattura di termini di ricerca errati può essere aggiunta molto tempo dopo, poiché non sono completamente convinto della sua utilità. Analisi per formule logiche booleane estese

LIKE "keyword*" AND ("text" ADJ "inflection")

è per utenti esperti.

Puoi anche separare le parti visivamente.

Nota: aggiornamento basato sull'utile commento di Marjan Venema.

    
risposta data 30.08.2013 - 09:28
fonte
1

Questo dipende totalmente dal caso d'uso, naturalmente ci possono essere molte applicazioni dove OR sarebbe la cosa giusta da fare.

In generale penso che la maggior parte degli utenti (specialmente se non molto esperti) capiranno meglio la variante AND. In questo modo (come dice il tuo cliente) puoi ridurre la quantità di risultati molto facilmente.

Ma ovviamente ci sono anche casi per OR. Soprattutto quando ci possono essere informazioni nella ricerca del testo in cui possono esistere diverse varianti per scrivere qualcosa e l'utente non può sapere quale è stato scelto.

In conclusione: vorrei iniziare con l'AND come presupposto di base (a meno che non ci sia una strong indicazione che questo è sbagliato per il tipo specifico di dati). Ma vorrei anche provare a fornire una sintassi semplice che permetta all'utente esperto di fallback di usare OR (e forse più opzioni). Forse una stringa di ricerca come questa: test [maybe1 OR maybe2 OR maybe3] che cercherebbe un testo che contiene 'test' e almeno una delle altre opzioni.

A seconda del tuo motore di ricerca puoi risolvere questo problema in qualche modo se puoi ordinare per rilevanza. In questo caso, per alcuni casi d'uso, la quantità di risultati potrebbe essere meno rilevante perché quelli con la maggior parte dei riscontri di parole chiave verrebbero ordinati in cima.

    
risposta data 30.08.2013 - 09:29
fonte
0

So che questo non ti dà la soluzione, ma hai considerato la possibilità di esaminare l'argomento del recupero delle informazioni? L'ho fatto all'università e, basandomi su quello che posso ricordare, funziona nel modo seguente:

  • Hai documenti
  • Hai un termine di ricerca
  • È quindi possibile utilizzare la probabilità per eseguire la scansione del documento utilizzando i termini di ricerca
  • Si finirebbe con i vettori che rappresentano i risultati. Ci sarà anche un vettore per il tuo termine di ricerca. L'angolo tra i vettori mostrerà chiudi il tuo termine in relazione al documento. L'angolo più piccolo tra i vettori rappresenterà la migliore corrispondenza, quando l'angolo più grande rappresenterà la peggiore corrispondenza.

    
risposta data 30.08.2013 - 09:49
fonte

Leggi altre domande sui tag