Guida del modulo di scansione del Web necessaria [chiuso]

1

Se ho un modulo creato sul mio sito web. Come posso ottenere quel modulo 1 per integrare i risultati in un altro modulo di siti web 2 ed estrarre informazioni da mostrare sul mio sito web?

Ad esempio, se volessi creare un modulo come cartagz.com per le tasse di registrazione sul mio sito web romarinsurance.com in modo che i miei clienti possano vedere le loro tasse di registrazione e pagare tramite il mio sito web.

Avrei bisogno di usare una sorta di software webcrawl per estrarre tali informazioni e mostrarle.

La mia ipotesi è che cartagz.com stia recuperando informazioni dal link

Dmv.ca.gov non ha api disponibili.

    
posta user313188 18.08.2018 - 10:42
fonte

1 risposta

0

Molti siti web governativi forniscono i loro dati attraverso dati aperti. Per la California, c'è un sito web che indicizza quali dati sono disponibili.

Se hai bisogno di affidarti a dati di terze parti, dovresti:

  • Utilizza un'API pubblica, se disponibile,
  • Oppure paga per poter utilizzare un'API privata,
  • Oppure contatta il proprietario del sito web per chiedere come dovresti accedere ai dati (sia gratuitamente che pagando una licenza).

Qualsiasi scansione non autorizzata potrebbe metterti nei guai:

  • L'interfaccia del sito Web (compresi gli URI delle pagine, la struttura generale, ecc.) può cambiare senza preavviso. Lo scoprirai scoprendo che il tuo sito web non funziona più.
  • Potresti semplicemente essere bloccato. Se l'utilizzo del sito web viene monitorato, è molto semplice vedere tali crawler e relativamente facile vietarli. La maggior parte dei siti Web non accetta con favore l'utilizzo delle risorse.
  • Se stai violando la licenza, potresti anche trovarti in giudizio e pagare multe importanti. Questo è probabilmente ciò che accadrà se utilizzi dati governativi senza autorizzazione.
risposta data 18.08.2018 - 10:57
fonte