У меня есть два HTML-файла, которые похожи, назовем их old.html и new.html.Замените конкретный блок HTML между 2 файлами с помощью Python
Я хочу открыть new.html, выполнить некоторую обработку, сохранить блок html. Я только что отредактировал и заменил соответствующий блок в old.html.
Так что если new.html выглядит следующим образом:
<html>
<table>
my content
</table>
</html>
И old.html выглядит следующим образом:
<html>
<!--other html -->
<table>
old content
</table>
<!-- other html -->
После этого old.html будет выглядеть следующим образом:
<html>
<!--other html -->
<table>
my content
</table>
<!-- other html -->
I думаю, что у меня есть первая часть этой проблемы, выяснилось, я просто не знаю, как реально модифицировать файлы. я подумал, может быть как-то с помощью какой-то замещающий текст будет работать, но я до сих пор не знаю, как заменить исходный блок кода из old.html
То, что я до сих пор:
from bs4 import BeautifulSoup as Soup
from soupselect import select
new_file = "\\path\\to\\new.html"
old_file = "\\path\\to\\old.html"
f = open(new_file, "rb")
soup = Soup(f)
new_table = soup.table
f2 = open(old_file, "rb")
soup2 = Soup(f2)
old_table = soup2.table
#process new_table here
#how do i replace old_table with new_table?
f.close()
f2.close()
Спасибо! К счастью, файлы, с которыми я работаю, в значительной степени гарантированно содержат только одну таблицу, так что это работает. Я не рассматривал использование регулярных выражений. Я думал, что мне понадобится библиотека, такая как BeautifulSoup, чтобы сделать тяжелый подъем. – marc
Рад, что это сработало для вас. Милая! Мой первый принятый ответ! – b10hazard