Recentemente, mi è stato chiesto di aiutare con qualche progetto di ottimizzazione laterale nella nostra azienda, ho fatto delle buone ricerche. Non sono ancora sicuro al 100% se questo è il modo più efficiente per farlo.
Problema:
- Scraping per oltre una dozzina di informazioni diverse da un sistema interno (sito Web) e passandole nel modello di documento di Microsoft Office.
Restrizioni:
- Il sito web funziona solo in IE 9
- Il sistema non ha alcuna API / servizi web
- Questo sarà usato in più di 100 diverse workstation
- Sulle workstation, sono ammessi solo IE 9, FF o Chrome
- Ottenere l'accettazione per l'installazione di qualsiasi software eccetto gli strumenti Windows predefiniti sulle workstation è quasi impossibile
Per questo abbiamo creato una piccola dimostrazione di funzionamento. Sta usando Visual Basic + javascript combo. Breve descrizione: Visual Basic apre l'istanza di IE, quindi utilizzando javascript siamo in grado di accedere al sistema, andare alle schede di cui abbiamo bisogno e trovare le informazioni corrette, quindi siamo in grado di inserire questi dati nel modello di Office.
Funziona, ma non sono sicuro che questo approccio sia il migliore.
Abbiamo provato diverse soluzioni, server nodejs, Selenium, altri web scrapers, ma sembrano avere alcune limitazioni.