Accetto con la risposta di @deviantfan e in particolare con questo punto
First, if the bot is a legitimate search engine bot (and nothing else), they won't hack you. If not, blocking a User agent won't help, they'll just use another one.
Vorrei sottolineare che come Yandex
e altri motori di ricerca in generale potrebbero non voler accedere intenzionalmente al tuo back-end. Ricorda che i bot stanno eseguendo la scansione dei siti seguendo i link, quindi immagina se i cattivi inserissero alcuni degli URL dei tuoi backend in alcune pagine di altri siti web e il motore di ricerca indicizzi semplicemente tali pagine e ora stia cercando di seguire i link da lì. Quindi, sembrerà che il motore di ricerca stia cercando di accedere al tuo back-end, ma si limita a gattonare la rete: non sa che è il tuo back-end.
Una cosa simile potrebbe accadere per caso. Diciamo che un utente esperto di tecnologia non ha pubblicato un url in qualche forum, che è accessibile solo quando si è effettuato l'accesso: eseguendo la scansione il motore di ricerca proverà a seguire tali collegamenti e finirai per vedere i log come presumo che tu abbia fatto.
UPDATE: penso che potresti voler impostare la regola robots.txt per impedire a yandex di accedere a URL specifici. A proposito, è meglio definire una regola specifica con il suo nome, non sono sicuro, ma potrebbe succedere che yandexbot possa ignorare User-agent: *
, quindi puoi fare smth in questo modo (secondo i tuoi URL di back-end)
User-agent: Yandex
Disallow: /admin/*
Quindi, in questo modo, non lo consentirai di accedere agli URL di back-end, facendo corrispondere tale modello, ma allo stesso tempo (yandexbot) sarà libero di eseguire la scansione di altre pagine del tuo sito web.