Я использую beautifulsoup, чтобы найти все p на определенной странице html, которую я сохранил локально. Моего кодаbeautifulsoup не находит всех p с определенным классом
with open ("./" + str(filename) + ".txt", "r") as myfile:
data=myfile.read().replace('\n', '')
soup = BeautifulSoup(data)
t11 = soup.findAll("p", {"class": "commentsParagraph"})
это коды работ для части страницы, но какая-то часть страницы загружаются с помощью AJAX (который я предварительно, прежде чем я спас источник), а код не работает на нем.
, чтобы проверить это, я добавил к одному из p
тегов в АЯКС части класса commentsParagraph2
и изменил код для
t11 = soup.findAll("p", {"class": "commentsParagraph2"})
но t11 является пустым списком.
Я прилагаю файл подкачки, а также here
Есть идеи?
Я предполагаю, что материал Ajax, который вы предварительно загружаете, не рассматривается beautifulsoup как частью DOM. –