Ho eseguito il mirroring di un sito di e-commerce utilizzando wget. Questo sito sembra utilizzare Cloudflare per gestire il traffico web.
La cosa interessante è che dopo che il 90% circa del mirroring è stato eseguito, wget ha iniziato a produrre / ricevere molti messaggi di errore. Ho quindi provato ad aprire il sito in un normale browser, ma sono stato accolto con un errore 403 e un messaggio da Cloudflare "La richiesta è stata bloccata". Ok, abbastanza giusto, probabilmente non vogliono che la gente scarichi 1.5 milioni di pagine da loro (che è quello che avevo fatto in quel momento).
Tuttavia
- Quando utilizzo Tor Browser sulla stessa macchina eseguo wget on per accedere allo stesso sito, ricevo lo stesso messaggio di errore.
- Quando accedo allo stesso sito utilizzando il mio secondo computer (entrambe le macchine sono connesse allo stesso WiFi) sia in un normale browser che nel browser Tor, funziona perfettamente.
Cloudflow è riuscito in qualche modo a prendere le impronte digitali sul computer su cui gira wget on in modo che sia possibile identificare anche il mio computer tramite Tor? Quante informazioni wget rivela quando si connette a un server web?
Quell'hardware è un Macbook Pro 15 abbastanza comune, quindi niente di straordinario lì.
Il browser Tor è in esecuzione utilizzando le sue impostazioni predefinite.