Я использую цикл for для сканирования веб-страниц. Тем не менее, я сталкиваюсь с ошибкой ограничения ip-запроса, когда я просматриваю некоторые страницы. Я попытался сделать python сон несколько секунд, когда я просканировал каждые 20 страниц, однако ошибка сохраняется. Я могу начать сканирование снова после того, как питон будет спать 60 секунд.Сканирование снова с исключительной страницы с помощью Python
Проблема заключается в каждом случае, когда есть исключение, я потеряю страницу информации. Кажется, что python перескакивает через исключительную страницу, используя метод try-except.
Мне интересно, как лучше всего перезапустить сканирование с страницы, которая столкнулась с исключением.
Мой вопрос - как перезапустить сканирование с исключительной страницы.
pageNum = 0
for page in range(1, 200):
pageNum += 1
if(pageNum % 20 ==0): # every 20 pages sleep 180 secs
print 'sleeep 180 secs'
time.sleep(180) # to oppress the ip request limit
try:
for object in api.repost_timeline(id=id, count=200, page=page):
mid = object.__getattribute__("id")
# my code here to store data
except:
print "Ip request limit", page
sleep.time(60)
Итак, в чем ваш вопрос? Ваш код, похоже, работает (или, по крайней мере, находится в правильном направлении). – betabandido
Благодарим вас за внимание. Проблема каждый раз, когда есть исключение, я потеряю страницу информации. Кажется, что python перескакивает через исключительную страницу, используя метод try-except. Мне интересно, как лучше всего перезапустить сканирование с страницы, которая столкнулась с исключением. Мой вопрос - как перезапустить сканирование с исключительной страницы. –
Разве вы не должны просто поставить try и исключить внутри цикла объекта? – Junuxx