Я учусь BeautifulSoup и есть веб-страницу, которая имеет тело что-то вроде этого:BeautifulSoup: Циклическое над элементами, чтобы получить текст
HTML:
<div>
<table>
<tr>
<td>
<div>
<a name='abc'>....</a>
</div>
</td>
</tr>
</table>
</div>
<a name='pqr'>...</a>
<div>text1</div>
<div>text2</div>
<div>text3</div>
<a name='mno'>...</a>
<div>
<table>
<tr>
<td>
<div>
<a name='xyz'>....</a>
</div>
</td>
</tr>
</table>
</div>
Ожидаемый результат:
<a name='pqr'>...</a>
<div>text1</div>
<div>text2</div>
<div>text3</div>
<a name='mno'>...</a>
Я хочу сказать, что все содержимое до тех пор, пока не будет достигнут тег 'name =' xyz '
Пытался передать («а», { «имя»: «ABC»}) в качестве аргумента, но он только что вернулся текст, написанный в между тегом 'a' – anonymous
@anonymous, почему вы это сделали? Функция 'wish_divs' предназначена для передачи в' find() 'или' find_all() ', как показано в примере кода. – alecxe
О да, какая глупая ошибка. Но я думаю, что ваша функция кода даст текст между всеми тегами div. Веб-страница довольно большая, и тело в значительной степени повторяется. Включая теги, которые называются «mno» и «pqr». Есть ли способ, которым я могу начать синтаксический анализ с «abc» до «xyz», потому что это тот, который продолжает меняться – anonymous