Использование BeautifulSoup для парсов Таблица

Я пытаюсь использовать BeautifulSoup для извлечения данных из таблицы HTML и преобразования его в фрейм-фрейм 7 с столбцами: дата, транзакция, номер манифеста, дата отправления, тип оплаты, сумма и предоплата Баланс.Использование BeautifulSoup для парсов Таблица

Отрывок из моего кода до сих пор:

def find_account_status(htmls): 
soup = BeautifulSoup(htmls) 
table = soup.find('table', border="0", cellpadding="2") 
table2 = table.find_all("td", {"class": "bodytext"}, text=True) 
print(table2.text.split())

Вот отрывок из HTML Я пытаюсь извлечь:

источник

2016-03-17 Riley Hun

Вы можете использовать pandas.read_html():

import pandas as pd 

soup = BeautifulSoup(htmls) 
table = soup.find('table', border="0", cellpadding="2") 
df = pd.read_html(str(table))[0]

источник

2016-03-17 20:16:12 alecxe

Пробовал загружая lxml из Pycharm, но я получаю следующую ошибку: ERROR: b "'xslt-config' не распознается как внутренняя или внешняя команда, \ r \ nпеременная программа или пакетный файл. \ r \ n" –

Потому что, когда я запускаю свой код, я получаю сообщение об ошибке «lxml не найден, пожалуйста, установите его» –

@RileyHun, есть много информации о проблемах и решениях по установке lxml, просто их Google. Или вы можете изменить парсер, предоставив аргумент 'flavor' ([docs] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_html.html)). – alecxe

Использование BeautifulSoup для парсов Таблица

ответ

Смежные вопросы