У меня есть некоторый код, который будет извлекать пары данных из HTML-файла с помощью BS4:Как извлечь определенные данные из файлов HTML?
from bs4 import BeautifulSoup
readfile = """
<html>
<head>
<meta name="generator"
<title></title>
</head>
<body>
<table align="center" border="1" cellpadding="0" cellspacing="1" width="650">
<tr>
<td>
<font size="1"> Title1</font>
<br /> </td>
<td>
<font size="1"> TItle2 type</font>
<br /> </td>
<td>
<font size="1"> Title3</font>
<br />
<font size="2">value1</font></td>
<td>
<font size="1"> Title4 ID</font>
<br />
<font size="2">value2</font></td>
</tr>
"""
soup = BeautifulSoup(readfile, "html.parser")
tables = soup.findChildren('table')
for title in soup.find_all("font", {"size": "1"}):
value = title.find_next_sibling("font", {"size": "2"})
print (title.text, ":", value.text if value else "No Value")
Давайте предположим, что у меня есть 30 строк в общей сложности. Мне нужно только 4 пары значений, поэтому я могу вставить их в rdbms.
Должен ли я попытаться использовать список размеров: 1 значения Я хочу получить размер: 2 значение? Посмотрите несколько примеров на BS4 и он не погружается. Спасибо
Каков ваш желаемый результат? – alecxe