Я работаю над тем, чтобы правильно анализировать XML-файлы и RSS-каналы, и у вас возникла небольшая проблема. Я использую feedbarser в python для синтаксического анализа определенной записи из RSS-канала, но не могу понять, как анализировать только один img src из раздела контента.RSS/Python - Разбор URL-адреса одного изображения
Вот что у меня есть.
import dirFeedparser.feedparser as feedparser
feedurl = feedparser.parse('http://dustinheroin.chompblog.com/index.php?cat=22&feed=rss2')
statusupdate = feedurl.entries[0].content
print statusupdate
Теперь, когда я печатаю содержание я получаю это:
[{'base': u'http://dustinheroin.chompblog.com/index.php?cat=22&feed=rss2', 'type': u'text/html', 'value': u'<p><a href="http://dustinheroin.chompblog.com/wp-content/uploads/2012/01/20120129-154945.jpg"><img alt="20120129-154945.jpg" class="alignnone size-full" src="http://dustinheroin.chompblog.com/wp-content/uploads/2012/01/20120129-154945.jpg" /></a></p>', 'language': None}]
Какой метод будет лучше, чтобы получить IMG SRC из этого? Любая помощь приветствуется, спасибо!
Значение, которое вы показали нам, что это '' Content' или statusupdate'. – RanRag