Come posso testare un motore di ricerca per un linguaggio umano non comune?

4

Stiamo scrivendo un motore di ricerca da zero in un linguaggio piuttosto raro, l'Aramaico, principalmente per scopi di apprendimento, ma anche perché poche risorse sono disponibili in una determinata lingua.

Il motore è / sarà scritto in Python e:

  1. È un motore di ricerca per la lingua umana.
  2. Non si tratta di pagare qualcuno per eseguire i test, ma di cercare di trovare un modo per risolvere il problema a livello di codice (se possibile) per scopi di apprendimento principalmente.

Vorremmo testare automaticamente se il motore di ricerca funziona in modo efficiente ma senza conoscere la lingua che ci stavamo chiedendo se ci fossero forse strumenti o modi per testare le statistiche. Se avessimo utenti che parlavano la lingua, potremmo chiedere loro di valutare i risultati della ricerca ma non di avere quello, quali sono gli altri modi per testare un motore di ricerca?

    
posta vallllll 11.07.2014 - 09:51
fonte

1 risposta

2

Questo è un problema molto difficile. Stai richiedendo un software di intelligenza artificiale per comprendere appieno la semantica e la cultura della lingua di destinazione, al fine di determinare la pertinenza dei risultati. Ci sono alcuni accorgimenti:

  1. Usa Google / Bing / qualsiasi altro motore di ricerca esistente per l'apprendimento e il test. In effetti, dovresti provare a duplicare l'algoritmo di ranking in modalità 'black box', usando metodi statistici per vedere se i risultati 'allineano' in base a qualche errore di metrica.

  2. Fai pubblicità per gli oratori della lingua di destinazione online (Turk meccanico o qualsiasi altro mercato di outsourcing), verificando sempre se i revisori parlano davvero kiswahili o qualsiasi altra lingua tu abbia bisogno.

EDIT: poiché questo è per i testi in aramaico (presumo il vecchio aramaico), suggerirei di guardare Biblical Hermeneutics.SE (suggerimento per TRiG), Christianity.SE e Mi Yodeya.SE per i collegamenti alle community online. Ci sono molte persone che conoscono molto bene la lingua.

    
risposta data 11.07.2014 - 10:42
fonte