Есть ли способ обойти следующее?Скребок экрана: обойти «Ошибка HTTP 403: запрос, запрещенный robots.txt»
httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt
Это единственный способ обойти это, чтобы связаться с сайта-владельца (BarnesAndNoble.com) .. я строю сайт, который принесет им больше продаж, не знаю, почему они запрещают доступ на определенной глубине ,
Я использую mechanize и BeautifulSoup на Python2.6.
надеясь на обходные
Есть, вероятно, юридические вопросы, если вы планируете монетизировать, но если вы не» t, продолжайте, как вам будет угодно. Да здравствует scroogle. –