У меня есть большое количество html-таблиц, которые я бы хотел преобразовать в CSV. Вставка отдельных таблиц в excel и сохранение их как .csv работает, как и вставка html-таблиц в простые онлайн-конвертеры. Но у меня есть тысячи отдельных таблиц, поэтому мне нужен скрипт, который может автоматизировать процесс преобразования.Сценарий, который преобразует html-таблицы в CSV (желательно python)
Мне было интересно, есть ли у кого-нибудь какие-либо предложения относительно того, как я могу это сделать? Python - единственный язык, на котором у меня есть приличное знание, поэтому какой-то скрипт python был бы идеальным. Я искал похожие вопросы, но все примеры python, которые я нашел, довольно сложны для меня и выходят за рамки моего базового уровня понимания.
Любой совет будет очень благодарен.
Это довольно широкий вопрос, который вы задаете там - вам нужна программа Python, которая [анализирует HTML] (https://docs.python.org/2/library/htmlparser.html), извлекает любые данные, содержащиеся в '
ответ
Использование
pandas
. Он имеет функцию чтения html-таблиц в структуру данных, а затем функцию, которая будет записывать эту структуру данных в файл csv.Обратите внимание, что так как HTML-страница может иметь более одной таблицы, то функция для получения таблицы всегда возвращает список таблиц (даже если имеется только одна таблица). Вот почему я использую цикл здесь.
источник
2015-03-19 10:22:33 TheBlackCat
Удивительный сценарий. Я не знал об этом - добавил к моим #protips – inspectorG4dget
У меня была игра с этим, и я думаю, что это будет идеально для моих нужд. Спасибо! – sellarsellar
Смежные вопросы