У меня есть html-документ, который я хотел бы извлечь из таблицы и префлотировать таблицы. До сих пор я знаю:prettifying часть html doc using beautifulsoup
with open('html.txt','r') as file1:
read_f=file1.read()
soup = BeautifulSoup(read_f)
the_soup=soup.findAll('table', {'id': 'table_id'})
with open('prettified.txt','w') as f2:
f2.write(the_soup.prettify())
Но я получаю сообщение об ошибке prettify, не является атрибутом.
Есть ли несколько '' table_id''? –
или он должен быть классным. Тем не менее, я читал беспорядочные таблицы html с тем же идентификатором. – user2883071