Я использую следующее регулярное выражение, чтобы получить значение src
первого тега img
в документе HTML.Regex, чтобы получить значение src из тега img
string match = "src=(?:\"|\')?(?<imgSrc>[^>]*[^/].(?:jpg|png))(?:\"|\')?"
Теперь он фиксирует общий атрибут src
, который мне не нужен. Мне просто нужен url внутри атрибута src
. Как это сделать?
он не ищет синтаксический анализ html, а просто извлекает значение из одного тега в html. Regexes превосходят такие вещи. –
@eqbridges: Тот факт, что регулярное выражение, которое он придумал, настолько сложно, является признаком того, что это неправильный способ решения проблемы. Тогда есть тот факт, что он не соответствует всем возможным значениям атрибутов src (т.е. содержащим «или»). Не разбирайте HTML/XML таким образом! Просто не делайте этого! – Welbog
@Welbog - если он только нужно вытащить значение img src, я с уважением не согласен. Использование анализатора HTML в такой задаче является излишним. Если ему нужно сделать что-то особенно сложное, то я с большей вероятностью соглашусь. –