Мне нужно запустить веб-искатель, и я хочу сделать это из EC2, потому что хочу, чтобы HTTP-запросы поступали из разных диапазонов IP-адресов, поэтому я не блокируюсь. Поэтому я думал, что распространение этого экземпляра EC2 может помочь, но я не могу найти никакой информации о том, какой диапазон исходящих IP-адресов будет. Я не хочу беспокоиться о том, чтобы вычислить дополнительную сложность EC2 и распределенных данных, только чтобы найти, что все экземпляры используют один и тот же блок адресов, и я все равно блокирую сервер.Можно ли использовать экземпляры EC2 для разных диапазонов IP-адресов?
ПРИМЕЧАНИЕ. Это не нападение DoS или что-то еще. Я пытаюсь собрать данные для законных целей бизнеса, я уважаю robots.txt, и я делаю только один запрос в секунду, но хост все еще закрывает меня.
Комментатор Пол Диксон предполагает, что действие блокировки даже моего скромного обхода указывает, что хост не хочет, чтобы я сканировал их, и поэтому я не должен этого делать (даже если я могу обойти блокировку). Согласны ли с этим люди?
Если хост обнаруживает ваши выскабливания и закрывает вас, возможно, вы должны уважать их желания, а не основывать на нем бизнес? –
FWIW, я делал именно такую блокировку на pastebin.com, и, видя, что IP-адрес, принадлежащий EC2, всегда был красным флагом. Вы можете использовать Tor, но его можно заблокировать, получив динамический список выходных узлов и заблокировав эти ips. –
, если это законная деловая проблема, почему бы вам не связаться с администратором этого хоста? Внешние IP-адреса всегда будут из диапазонов, которые легко идентифицируются как EC2, независимо от того, как вы распространяете свои экземпляры. – sfussenegger