Я следующий XML часть:новичку питон beautifulSoap экстракт articlebody из NewsArticle
<section class="article-body">
<!-- <EdIndex> -->
<div class="squared-inline-picture-offset no-mobile">
<picture class="lazy square pull-left">
<img height="" width="" alt="" src="" class="loaded">
<noscript><img src="" width="" height="" alt="" /></noscript>
</picture>
</div>
<p>bla1 bla1 bla1</p>
<p>bla2 bla2 bla2</p>
<p>bla3 bla3 bla3</p>
<!-- </EdIndex> -->
<div class="adv no-mobile">
</div>
</section>
и мне нужно, чтобы извлечь «бла-бла-бла» часть. Я попытался с
soup = BeautifulSoup(data)
[...]
soup.findAll('section',{"class" : "article-body"})
с плохими результатами :(
любой намек? Существуют ли какие-либо способ быстро получить статью тело от http://schema.org/NewsArticle с помощью питона и BeautifulSoap?
Заранее спасибо
Можете выложить на "* плохие результаты *"? –