pandas
предоставляет полезный to_html()
для преобразования DataFrame
в html table
. Есть ли полезная функция, чтобы прочитать ее обратно до DataFrame
?Как преобразовать таблицу html в dataframe pandas
10
A
ответ
7
read_html утилита выпущена в панд 0,12
3
В общем случае это не представляется возможным, но если вы приблизительно знаете структуру вашей таблицы вы могли бы что-то вроде этого:
# Create a test df:
>>> df = DataFrame(np.random.rand(4,5), columns = list('abcde'))
>>> df
a b c d e
0 0.675006 0.230464 0.386991 0.422778 0.657711
1 0.250519 0.184570 0.470301 0.811388 0.762004
2 0.363777 0.715686 0.272506 0.124069 0.045023
3 0.657702 0.783069 0.473232 0.592722 0.855030
Теперь разобрать HTML и реконструировать:
from pyquery import PyQuery as pq
d = pq(df.to_html())
columns = d('thead tr').eq(0).text().split()
n_rows = len(d('tbody tr'))
values = np.array(d('tbody tr td').text().split(), dtype=float).reshape(n_rows, len(columns))
>>> DataFrame(values, columns=columns)
a b c d e
0 0.675006 0.230464 0.386991 0.422778 0.657711
1 0.250519 0.184570 0.470301 0.811388 0.762004
2 0.363777 0.715686 0.272506 0.124069 0.045023
3 0.657702 0.783069 0.473232 0.592722 0.855030
You может расширять его для обнаружения данных Multiindex dfs или автоматического типа с использованием eval()
, если необходимо.
Смежные вопросы
- 1. Pandas: преобразовать таблицу dbf в dataframe
- 2. Как преобразовать многоуровневый индекс DataFrame в латексную таблицу (Pandas-Jupyter)?
- 3. Как преобразовать pandas/dataframe в XML?
- 4. Как преобразовать значение pandas dataframe?
- 5. Преобразование таблицы html в dataframe pandas
- 6. Как преобразовать серии в dataframe в Pandas
- 7. Как преобразовать массив numpy в pandas dataframe
- 8. Как преобразовать таблицы OpenDocument в pandas DataFrame?
- 9. Как преобразовать вложенный словарь в pandas dataframe?
- 10. Как преобразовать pandas DataFrame в TimeSeries?
- 11. Форматирование HTML в Pandas DataFrame
- 12. Как преобразовать таблицу в Спарк Dataframe
- 13. IPython Notebook & Pandas: Как pandas создает таблицу html?
- 14. Может pandas groupby преобразовать DataFrame в серию?
- 15. Pandas: DataFrame в DataFrame
- 16. pandas объединяет сводную таблицу с DataFrame
- 17. Получить таблицу HTML в pandas Dataframe, а не список объектов dataframe
- 18. Как преобразовать Spark RDD в pandas dataframe в ipython?
- 19. Как преобразовать Pandas Dataframe в csv-ридер непосредственно в python?
- 20. Как преобразовать индекс pandas в dataframe в столбец?
- 21. Как преобразовать timestamp в datetime.date в pandas dataframe?
- 22. Как преобразовать строку, например, 1.424304064E9 в datetime в pandas dataframe?
- 23. Pandas: Записать в Dataframe
- 24. Преобразовать DataFrame в Словаре
- 25. преобразовать arraylist в таблицу html
- 26. Как вставить pandas DataFrame в существующую таблицу PostgreSQL?
- 27. Программно преобразовать рамку данных pandas в таблицу уценки
- 28. Pandas dataframe to AnguarJS
- 29. Как открыть и преобразовать базу данных sqlite в pandas dataframe
- 30. Pandas и dataframe: Как преобразовать порядковую переменную в двоичную переменную?
Я думаю, что нет, но это не должно быть слишком трудно с небольшой помощью 'lxml' ... – root
Кроме того, преобразование в' html' с потерями, так как информация типа теряется, поэтому вам нужно будет указать ее самостоятельно. В любом случае, если 'df' относительно прост (например, однородные типы данных), преобразование должно занимать всего несколько строк кода. – root
У pandas есть некоторые методы вывода типа, которые пытаются смягчить эту проблему, и они выполняют довольно хорошую работу. –