Come creare un servizio Web per rilevare modifiche ai contenuti in un sito Web esterno?

1

Sto cercando modi per creare un servizio Web per attraversare periodicamente un elenco predeterminato di pagine Web (di un altro sito Web esterno) per rilevare se il contenuto di una pagina è cambiato da

  1. modifica della pagina e
  2. cancellazione della pagina.

L'obiettivo finale è far sì che questo servizio web pubblichi eventi di notifica push sui dispositivi mobili.

Per tua informazione, ho cercato e letto "Domande con titoli simili" qui.

Grazie per aver condiviso le tue risposte.

    
posta Global nomad 24.03.2012 - 19:32
fonte

2 risposte

2

Che ne dici di leggere la pagina con cURL? Forse memorizza un checksum di ciò che leggi e confronti rispetto alla prossima volta.

    
risposta data 24.03.2012 - 21:48
fonte
2

La modifica della pagina può essere verificata da:

  1. Verifica se l'intestazione HTTP last-modified è presente. Se lo è, confrontalo con il valore precedentemente memorizzato e hai finito.
  2. Se l'intestazione HTTP last-modified non è presente, memorizza il checksum della pagina o il checksum della parte importante della pagina. Poiché alcune pagine Web contengono parti generate casualmente, si desidera ignorare queste parti. È possibile definire "parte importante" della pagina utilizzando, ad es. espressione regolare. La prossima volta confronterai il checksum memorizzato con quello nuovo.

È possibile controllare la cancellazione della pagina semplicemente cercando di connettersi ad essa.

    
risposta data 24.03.2012 - 23:21
fonte

Leggi altre domande sui tag