2010-01-29 4 views
5

Есть ли способ заставить паука замедлить его пауки веб-сайта? Все, что может быть помещено в заголовки или robots.txt?Замедление паука сайта

Мне показалось, что я помню, как читал что-то об этом, но ничего не могу найти.

+0

Почему вы хотите замедлить его? –

ответ

14

Если вы имеете в виду Google, вы можете ограничить скорость, с которой Google использует ваш сайт, используя свою учетную запись Google для веб-мастеров (Google Webmaster Tools).

Существует также это, что вы можете поместить в robots.txt

User-agent: * 
Crawl-delay: 10 

Если задержка ползать указан как количество секунд между каждой страницы ползти. Конечно, как и все остальное в robots.txt, искатель должен его уважать, поэтому YMMV.

0

Я не думаю, что роботы будут делать что-либо, кроме разрешения или запрета. Большинство поисковых систем позволят вам настроить, как они индексируют ваш сайт.

Например: Bing и Google

Если у вас есть конкретный агент, который вызывает проблемы, вы можете либо блокировать его специально, или если вы можете настроить его.

5

Beyond с помощью инструментов Google для веб-мастеров для Googlebot (см ответ Роберт Харви «s), Yahoo! и Bing поддерживают нестандартную Crawl-delay директиву robots.txt:

http://en.wikipedia.org/wiki/Robots.txt#Nonstandard_extensions

Когда дело доходит до драки, однако, плохой бот, который захлопывает ваш сайт, просто должен быть заблокирован на более высоком уровне (например, балансировщик нагрузки, маршрутизатор, кеширующий прокси, что подходит для вашей архитектуры).

2

См. Throttling your web server для решения с использованием Perl. Рэндал Шварц сказал, что он пережил атаку Slashdot, используя это решение.

Смежные вопросы