Lavoro in una grande azienda, e siamo bloccati da uno schifoso strumento di tracciamento dei bug, che fa troppe cose a metà, ma la sua funzionalità di ricerca è quasi impossibile da usare (ha circa 80 campi che uno deve / può compilare) e la ricerca deve essere precisa. Abbiamo molti bug duplicati archiviati che non sono mai stati consolidati, oltre a eliminare tutti i bug archiviati su alcuni prodotti in alcune versioni non sarà affatto facile.
Eliminare l'attuale sistema è un'impossibilità politica e strategica. Centinaia di persone sono legate a questo. Quello che spero di fare è iterare sui bug 1 attraverso molti (credo, c'è un modo) e poi salvare le pagine HTML risultanti chiamate "bug000001.html", "bug000002.html", ecc. Dopo ciò vorrei una sorta di indicizzazione full-text in stile Google. Quello che abbiamo è così brutto, che fare questo sarebbe utile. I bug non cambiano molto nel tempo, quindi non sono così preoccupato di non essere sincronizzato con l'originale - non sarà fantastico.
Quindi la mia domanda è: supponiamo di aver scaricato i file html nella stessa cartella. Quale strumento gratuito e open source posso utilizzare per consentire la ricerca fuzzy sul contenuto? Mi rendo conto che posso inventare una regex specifica ogni volta che cerco che probabilmente farò il compito, ma mi piacerebbe renderlo ancora più facile, dove le ortografie sbagliate non fanno male. Mi rendo conto che la piena efficacia della ricerca personalizzata basata sulla cronologia di Google non sarà probabilmente accessibile per me, ma accontenterò volentieri per qualcosa di simile, che sia gratuito e facile da usare.
Se hai suggerimenti per un buon strumento gratuito e open source / libreria Python che posso usare per automatizzare semplici azioni del browser, come inserire testo in una casella di testo, fare clic sul pulsante e quindi salvare il contenuto in un file HTML, quindi per favore elencalo pure, anche se probabilmente dovrebbe essere una domanda a parte.
EDIT Non ho accesso al codice sorgente per il front-end o il back-end di PhP; questo è tutto bloccato dai socialisti di un altro continente.