In un lavoro che ho iniziato di recente, ho ereditato alcuni dei progetti del ragazzo che in precedenza deteneva questa posizione. Uno dei progetti era un programma che utilizzava l'API pubblica di una piattaforma Web per ottenere determinati dati dal loro sito. Il programma stesso è piuttosto semplice e viene scritto correttamente da quello che posso dire. Non è così complicato, quindi probabilmente qualsiasi grosso errore sarebbe rimasto fuori. Durante il test di questo programma, tuttavia, ottengo risultati incoerenti rispetto al loro sito web. Ex. Ricerca utilizzando una parola chiave nel programma produce 30 risultati e Ricerca utilizzando la stessa parola chiave esatta sul loro sito ufficiale produce 60 risultati.
Dopo la ricerca, ho scoperto che ciò era dovuto al fatto che le due ricerche utilizzano diversi meccanismi interni per restituire i risultati. Giusto. Stavo pensando di contattare il mio capo per riscrivere questa applicazione e utilizzare un approccio in cui interrogo direttamente il sito Web, ottenere l'HTML, trovare la classe specifica in cui risiede il testo che voglio e ottenerlo da lì. Non dovrebbe essere così difficile (lo so, le ultime parole famose ...) e aiuterebbe i nostri risultati ad essere più accurati e più estesi.
Prima che potessi parlargli di questo, ha detto che vuole fare lo stesso genere di cose, ma con un altro sito con una piattaforma simile. Hanno anche una API, ma mi chiedo se stiamo per incontrare gli stessi problemi anche qui in fondo alla strada.
Il mio capo non è un programmatore e non conosce le specifiche delle API e delle query Web, ecco perché sto chiedendo qui. È una cattiva idea non utilizzare l'API pubblica di qualcuno e invece elaborare solo l'HTML non elaborato per i dati che voglio?