У меня есть веб-страница. Из этого я хочу найти все теги IMG и получить SRC этих тегов IMG.Регулярное выражение для поиска src из тега IMG
Каким будет регулярное выражение для этого.
Некоторые пояснения:
Я соскабливания веб-страницы. Все данные отображаются корректно, кроме изображений. Чтобы решить эту проблему, ничего себе у меня есть идея, чтобы найти SRC и заменить его: например
/images/header.jpg
и заменить это
www.stackoverflow/images/header.jpg
Это зависит от потребностей человека. Что, если он хочет, чтобы он был выписан из пользовательского ввода? –
Он все равно мог загрузить его в парсер, и даже более того, если это от пользователя. Обсуждался ad-nauseam, почему регулярные выражения - плохая идея для синтаксического анализа HTML. –
Ничего себе, это битва за «Па [ou] lo's :-) – paxdiablo