Я пытаюсь извлечь URL-адрес источника изображения из тега HTML img.Как извлечь src в тег img с регулярным выражением?
если HTML данные, как показано ниже:
<div> My profile <img width='300' height='300' src='http://domain.com/profile.jpg'> </div>
или
<div> My profile <img width="300" height="300" src="http://domain.com/profile.jpg"> </div>
, как это регулярное выражение в Python?
Я попытался ниже:
i = re.compile('(?P<src>src=[["[^"]+"][\'[^\']+\']])')
i.search(htmldata)
, но я получил ошибку
Traceback (most recent call last):
File "<input>", line 1, in <module>
AttributeError: 'NoneType' object has no attribute 'group'
Вы уже пытались создать регулярное выражение себя; что поможет – Evert
Вышеуказанные 2 строки кода не дают вам этой ошибки. – Evert
Возможный дубликат [Python Regex String Extraction] (http://stackoverflow.com/questions/7384275/python-regex-string-extraction) – ozy