Tutta questa discussione probabilmente appartiene a Pro Webmasters, comunque; come indicato in uno dei commenti è applicabile anche qui.
Avere diversi motori di ricerca colpisci il tuo sito contemporaneamente è un comportamento assolutamente normale. Se sei riuscito a ottenere collegamenti al tuo sito da altri siti affidabili, verrai indicizzato. I più brutali sono Yahoo, Yandex e Baidu. La prima volta che il nostro sito Web si è impantanato, sono entrato in modalità DDOS e mi sono sentito in gran parte imbarazzato trovando che ogni IP proveniva da fonti riconosciute di Microsoft, Yahoo e Google (verificate dalla proprietà del blocco IP, non da UA Strings). La risposta è stata quella di rafforzare le risorse del sito Web per gestire il carico.
Nonostante ciò che si ipotizza sul numero di utenti simultanei, il tuo server web deve essere in grado di gestire Google, Bing e Yahoo indicizzando contemporaneamente il tuo sito e il traffico previsto. Se il tuo sito non può prendere il carico dall'indicizzazione, dovrai escludere o limitare i motori di ricerca. Sebbene vi sia questa patetica voce robots.txt che è quasi supportata, otterrai risultati migliori iscrivendoti a Google, Bing, strumenti per webmaster Yandex e utilizzerai le loro pagine di limitazione per modellare il loro traffico di indicizzazione per adattarsi al meglio al programma del tuo sito web.
Verifica da dove proviene il traffico analizzando i log di accesso del tuo server web. Cerca gli IP (http://www.botsvsbrowsers.com/ è uno di questi strumenti per aiutare a identificare le fonti di traffico dei bot). Yandex e Baidu sono rispettivamente in Europa orientale e in Cina. Se non sono nella tua sede, vietali per salvare la larghezza di banda.
EDIT: Dopo aver esaminato i log di accesso, fai attenzione agli improvvisi aumenti del traffico da una stringa UA del motore di ricerca nota con stringhe di query dispari. Le stringhe di User Agent non sono la prova che il traffico proviene da chi dicono di provenire mentre la persona che invia il traffico può generarle a volontà e cercare di nascondersi dietro l'identità di UA.