Sono abituato a trovare un sondaggio casuale dai bot di script nei miei file di log di apache, ma oggi ho trovato alcune voci strane: - - [25/Apr/2014:01:52:36 +0000] "GET /calendar/caldetail/id/281/num/1328144400 HTTP/1.1" 404 439 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +" - - [05/Apr/2014:06:19:08 +0000] "GET /media/u1485/album/pic_1485_3218_original.jpg HTTP/1.1" 404 443 "-" "facebookexternalhit/1.1 (+"

C'erano numerose altre voci simili a queste.

La cosa strana è che sembra provenire dai server Facebook o Microsoft . Entrambi forniscono informazioni identificative e indirizzi IP che sembrano appartenere alle organizzazioni di cui sopra.

Non ho URL che sembrano vicini a quelli trovati nelle richieste GET. Per dare qualche background, ho comprato il dominio qualcosa come un mese fa e AFAIK non è stato usato prima.

Qualcuno può far luce sulle possibili cause di queste richieste?

posta Salvador Dali 14.05.2014 - 09:35

1 risposta


Come indicato nella pagina collegata nella stringa user-agent, la pagina viene "scansionata" perché qualcuno ha provato a condividi su Facebook.

Facebook allows its users to send links to interesting web content to other Facebook users. Part of how this works on the Facebook system involves the temporary display of certain images or details related to the web content, such as the title of the webpage or the embed tag of a video. Our system retrieves this information only after a user provides us with a link. You may have found this page because a Facebook user sent a link from your website to other Facebook users. If you have any questions or concerns about any links or content sent by one of our users, please contact us at [email protected].

Forse qualcuno ha fatto un refuso in un URL durante il tentativo di pubblicare qualcosa sul loro muro? In alternativa, è possibile che quegli URL fossero validi prima di acquistare il dominio (potrebbe essere stato precedentemente di proprietà di qualcun altro).

risposta data 14.05.2014 - 10:23

