У меня есть следующий «веб-сайт» (здесь есть кусок HTML):Beutifulsoup разбора, получить информацию от нижестоящего тега
<div class="moduleBody">
<div class="feature">
<div class="feature">
<h2>
<a href="somelink">sometext</a>
</h2>
<div class="relatedInfo">
<span class="relatedTopics">
<span class="timestamp">22 Mar 2014</span>
</div>
</div>
</div>
Я хотел бы, чтобы извлечь SOMETEXT и somelink , С этой целью я написал код python, вот он:
for links in soup.find_all('div','moduleBody'):
for link in links.find_all('div','feature'):
if not("video" in (link['href'])):
print "Name: "+link.text
#sibling_page=urllib2.urlopen("major_link"+link['href'])
print " Link extracted: "+link['href']
Однако этот код ничего не печатает. Не могли бы вы предложить, где моя ошибка?