У меня есть HTML-структуру, подобную этойPython: Как найти текст первого тега привязки с помощью BeautifulSoup
<p class="title">
<a href="abc.com">
Story
</a>
<span class="domain">
<a href="xyz.com">comments</a>
</span>
</p>
Я хочу, чтобы извлечь текст первого тега привязки, то есть Story
Вот как я я с помощью Beautifulsoup
для извлечения текста из тега привязки
soup = BeautifulSoup(html, 'html.parser')
soup.prettify()
for link in soup.find_all(class_='title'):
print link.findNext('a').text
и выход:
Story
Comments
Но я хочу извлечь только текст первого якорного тега, то есть Story
. Как это сделать, используя BeautifulSoup в python?
я получил эту ошибку AttributeError: объект «NoneType» не имеет атрибута «get_text» –
@ShoaibAkhtar пор HTML отличается от того, что вы представили. – alecxe