я пытаюсь получить данные с сайта, который имеет следующий вид: «http://www.mysite.here?pageNo=2»Синтаксического диапазон ССЫЛОК urllib2 или BeautifulSoup
Как получить HTML-данные из последовательного диапазона страниц с использованием urllib2 и/или BeautifulSoup? Этот код возвращает html только для первой страницы.
import urllib2
from bs4 import BeautifulSoup
for x in range(1,450):
numb = str(x)
url = "http://www.mysite.here?pageNo="+numb
page = urllib2.urlopen(url).read()
soup = BeautifulSoup(page, "html.parser")
Print soup
Хм ... Я всегда пишу другой код внутри этого 'for' цикла, если я хочу сделать то же самое со всеми *' soup' * объектов: P –
Спасибо, это работает! – Panoid