Я не буду заинтересован в местах общественных облицовочных (ничего за вход/аутентификации), которые имеют такие вещи, как:Веб-сайты, которые особенно сложны для ползания и царапины?
- Высокого использование внутреннего 301 и 302 перенаправляет
- Anti-скребковые мер (но не запрещающие сканеры через robots.txt)
- несемантических, или недействительный разметки
- Содержимое загружается через AJAX в виде onclicks или бесконечной прокруткой
- Множество параметров в адресах
- Канонические проблемы
- Соединительная внутренняя структура ссылок
- и все остальное, что в целом делает сканирование веб-сайта головной болью!
Я построил сканер/паук, который выполняет широкий спектр анализов на веб-сайте, и я нахожусь в поисках сайтов, которые будут бороться.
ли вам после того, как список сложных сайтов или методов для очистки сложных сайтов? Я не уверен, что запрос здесь. – halfer
Я после списка сложных сайтов. Чтобы дать вам некоторый опыт, я создал искатель/паук, который выполняет целый ряд анализов на веб-сайте, и я нахожусь в поиске сайтов, которые заставят его бороться. –
Ah righto. Я бы сказал, что это, вероятно, вне темы, поскольку это запрос на внешние ресурсы; однако, поскольку это интересный вопрос, я не буду голосовать за закрытие. Мне должно быть интересно узнать, что происходит, хотя я сам работаю над самим проектом. – halfer