я пытаюсь получить некоторые всю HREF URL-адреса из вложенного HTML кода:Python вложенной HTML-теги с BeautifulSoup
...
<li class="dropdown">
<a href="#" class="dropdown-toggle wide-nav-link" data-toggle="dropdown">TEXT_1 <b class="caret"></b></a>
<ul class="dropdown-menu">
<li class="class_A"><a title="Title_1" href="http://www.customurl_1.com">Title_1</a></li>
<li class="class_B"><a title="Title_2" href="http://www.customurl_2.com">Title_2</a></li>
...
<li class="class_A"><a title="Title_X" href="http://www.customurl_X.com">Title_X</a></li>
</ul>
</li>
...
<li class="dropdown">
<a href="#" class="dropdown-toggle wide-nav-link" data-toggle="dropdown">TEXT_2 <b class="caret"></b></a>
<ul class="dropdown-menu">
<li class="class_A"><a title="Title_1" href="http://www.customurl_1.com">Title_1</a></li>
<li class="class_B"><a title="Title_2" href="http://www.customurl_2.com">Title_2</a></li>
...
<li class="class_A"><a title="Title_X" href="http://www.customurl_X.com">Title_X</a></li>
</ul>
</li>
...
В оригинальном HTML коде есть около 15 «Ли» блоков с классом «выпадающим список ", , но я хочу получить только URL-адреса из блока с текстом = TEXT_1. Можно ли захватить все эти вложенные URL с помощью BeautifulSoup?
Спасибо за помощь
Нельзя использовать регулярное выражение; используйте [парсер HTML] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454). – Docteur
Я уже пробовал с регулярным выражением, и это работает, но результат не очень хорош. – Reat0ide
Независимо от того, что плавает ваша лодка - вы ** можете ** использовать регулярное выражение, но вы ** не должны **. – Docteur