Usando ASP.Net, voglio implementare la ricerca full-text usando Lucene / Solr su un GRANDE numero di documenti (word, pdf ecc.) che risiedono in una directory su un'unità NAS. L'unità NAS verrebbe mappata come unità di rete sul server. L'elenco dei documenti viene cambiato frequentemente. Secondo la mia ricerca, Lucene non indice direttamente pdf / word docs. I dati grezzi dei documenti devono essere estratti e quindi passati all'indicizzatore di Lucene. È consigliabile utilizzare PDFBox e altri strumenti di terze parti per estrarre dati binari e passare all'indicizzatore di Lucence. Quale sarebbe l'impatto sulla performance della ricerca di Lucene? Devo usare Solr al posto di Lucene in quanto supporta l'indicizzazione dei documenti pdf / word?