Как использовать регулярное выражение Python для получения изображения src?

Как использовать регулярные выражения, чтобы получить ЦСИ изображения из следующего HTML строку с помощью PythonКак использовать регулярное выражение Python для получения изображения src?

<td width="80" align="center" valign="top"><a href="http://news.google.com/news/url?sa=t&fd=R&usg=AFQjCNFqz8ZCIf6NjgPPiTd2LIrByKYLWA&url=http://www.news.com.au/business/spain-victory-faces-market-test/story-fn7mjon9-1226390697278"><img src="//nt3.ggpht.com/news/tbn/380jt5xHH6l_FM/6.jpg" alt="" border="1" width="80" height="80" /> NEWS.com.au</a></td>

Я пытался использовать

matches = re.search('@src="([^"]+)"',text) 
print(matches[0])

Но ничего не получил

источник

2012-06-10 Don Li

Что такое '@' символ должен соответствовать? В строке ввода нет такого символа. –

регулярные выражения и html? – Ben

http://stackoverflow.com/a/1732454/311220 – Acorn

Просто потерять @ в regex и будет работать

источник

2012-06-10 20:26:00 buckley

-1

Вы можете упростить свой re немного:

match = re.search(r'src="(.*?)"', text)

источник

2012-06-10 20:30:07

Он также получает файлы javascript. –

Вместо регулярных выражений, вы могли бы рассмотреть вопрос об использовании BeautifulSoup:

>>> from bs4 import BeautifulSoup 
>>> soup = BeautifulSoup(junk) 
>>> soup.findAll('img') 
[<img src="//nt3.ggpht.com/news/tbn/380jt5xHH6l_FM/6.jpg" alt="" border="1" width="80" height="80" />] 
>>> soup.findAll('img')[0]['src'] 
u'//nt3.ggpht.com/news/tbn/380jt5xHH6l_FM/6.jpg'

источник

2012-06-10 20:33:12 fraxel

не будет красивым супом добавить много накладных расходов на решение? Теги 'img' относительно легко разбираются (и поскольку они не заключают другой текст, обычно форматируются правильно) –

Как использовать регулярное выражение Python для получения изображения src?

ответ

Смежные вопросы