Я хочу получить ссылки на изображения из img src в html. У меня есть строка html, которую я читаю в методе, который возвращает arraylist URL-адресов изображений.C# Regex img src
В метод передаю строку html и URL-адрес веб-страницы.
Мне нужна помощь с регулярным выражением, чтобы получить имя изображения с расширением. Если вы можете помочь с сопоставлением с строкой html, которая будет бонусом. Я согласен с правильным ответом или рядом с ним, спасибо всем.
Я слышал о парсерах HTML, но я предпочел бы использовать этот способ, спасибо.
вот мой метод:
private ArrayList GetImageLinks(String inputHTML, String link)
{
ArrayList imageLinks = new ArrayList();
var regex = new Regex(@"<img.*?src=[\"'](.+?)[\"'].*?");
//using http://gskinner.com/RegExr/ this regex seems to get: <img src="beach.png" for example. while I need just beach.png.
//match the regex to the html and get all the image links like: image5.png
//link = inputHTML + link
//add new link to arraylist
return imageLinks;
}
Анализ HTML с помощью Regex, что может пойти не так. –
Нет никакой веской причины не использовать HtmlAgilityPack для этого. Если вы действительно хотите регулярного выражения, вы должны сделать это сами, так как по крайней мере у вас будет небольшой шанс понять это регулярное выражение в вашем коде, когда вы увидите его через месяц. –
Возможный дубликат [Regex для получения значения src из тега img] (http://stackoverflow.com/questions/1058852/regex-to-get-src-value-from-an-img-tag) - даже содержит некоторые версия регулярного выражения решения ... –