Alla ricerca di buoni libri sulla teoria dietro i motori di ricerca [chiuso]

6

Sto lavorando a un progetto che richiede di comprendere diverse tecniche utilizzate dai motori di ricerca per il web.

Ho un strong background scientifico e di sviluppo, quindi non ho paura di informazioni altamente tecniche.

Sto cercando tutte le forme di informazioni tecniche incluse le informazioni sui web crawler, altre tecniche per acquisire dati, metodi di archiviazione dei dati e come interrogarli, ecc. ecc.

Sono completamente nuovo all'argomento e sto cercando risorse e libri utili sull'argomento. Qualsiasi suggerimento è apprezzato.

    
posta sebpiq 03.09.2011 - 20:04
fonte

3 risposte

2

Questa area di studio è conosciuta come Information Retrieval. Questo articolo di Wikipedia contiene un buon sommario e molti link utili.

    
risposta data 03.09.2011 - 22:34
fonte
2

In primo luogo, Google partecipa attivamente alla "scienza" della tecnologia e spesso condivide le proprie conoscenze rilasciando articoli dal proprio dipartimento R & D. Puoi trovare quei documenti dal link di riferimento qui sotto. Non ho cercato documenti specifici sugli algoritmi di ricerca, ma ci dovrebbero essere più che sufficienti informazioni disponibili sull'argomento da un punto di vista molto tecnico, così come documenti su come archiviare enormi serie di dati e interrogarli efficacemente.

Pubblicazioni di googlers

Oltre alle risorse di Google, consiglio vivamente di esaminare la ricerca sul Web semantico. Il web semantico non è un metodo di ricerca dei dati e anche se inizialmente il concetto sembra un po 'vago, le chiare implicazioni di un "motore" del web semantico sarebbero di analizzare le informazioni all'interno del WWW e collegare le informazioni rilevanti l'una con l'altra.

In breve, il web semantico è la scienza di ciò che molti prospettici sperano e stanno lavorando per Internet per diventare veramente dove le informazioni fornite sono ben analizzate, interpretate e collegate correttamente. Non ho esaminato molto me stesso, quindi alcune delle mie informazioni potrebbero essere un po 'errate. Tuttavia, ci sono un sacco di risorse disponibili che discutono il web semantico e molti sperano / aspettano / lavorano su una rottura attraverso il campo con la speranza di fare la "prossima grande cosa" per Internet.

Un buon punto di partenza per conoscere il web semantico è, naturalmente, Wikipedia .

Questi riferimenti potrebbero non essere libri ma sono molte informazioni. Leggere e setacciare tutte le informazioni tecniche dovrebbe tenerti occupato per un po '.

    
risposta data 03.09.2011 - 22:36
fonte
0

Seguendo i consigli di @Andy Waite ho letto la pagina di wikipedia sul recupero delle informazioni e ho seguito i riferimenti. Vi sono molte informazioni online e trovo questo introduzione al recupero delle informazioni , che è un libro online del 2008, quindi probabilmente aggiornato, e che sembra essere una buona introduzione al tema.

    
risposta data 04.09.2011 - 11:26
fonte

Leggi altre domande sui tag