Я создал проект Scrapy с несколькими пауками, чтобы сканировать некоторые веб-сайты. Теперь я хочу использовать TOR для:Scrapy with TOR (Windows)
- Скрыть мой ip с обходных серверов;
- Свяжите мои запросы с разными ips, имитируя доступ от разных пользователей.
Я прочитал некоторую информацию об этом, например: using tor with scrapy framework, How to connect to https site with Scrapy via Polipo over TOR?
Ответы из этих ссылок не были полезны для меня. Каковы шаги, которые я должен предпринять для правильной работы Scrapy с TOR?
EDIT 1:
Учитывая ответ 1, я начал устанавливать TOR. Когда я пользуюсь Windows, я скачал пакет TOR Expert Bundle (https://www.torproject.org/dist/torbrowser/5.0.1/tor-win32-0.2.6.10.zip) и прочитал главу о том, как настроить TOR как реле (https://www.torproject.org/docs/tor-doc-windows.html.en). К сожалению, информации о том, как это сделать в Windows, мало. Если я распакую загруженный архив и запустил файл Tor \ Tor.exe, ничего не произойдет. Однако в диспетчере задач я вижу, что создается новый процесс. Я не знаю, как лучше всего двигаться дальше.
Что вы уже достигли? В чем дело? Пожалуйста, отредактируйте свой вопрос и объясните это нам, чтобы мы могли помочь. – GHajba
этот проект scrapy на github объясняет, как сменить anonymoulsy: https://github.com/WiliTest/Anonymous-scrapping-Scrapy-Tor-Privoxy-UserAgent –