Я хочу проанализировать все теги ссылок из html-файла. Поэтому для этого я написал следующее регулярное выражение, как показано ниже.Регулярный выпуск группы захвата выражения
var pattern = @"<(LINK).*?HREF=(""|')?(?<URL>.*?)(""|')?.*?>";
var regExOptions = RegexOptions.Compiled | RegexOptions.IgnoreCase | RegexOptions.Multiline;
var linkRegEx = new Regex(pattern , regExOptions);
foreach (Match match in linkRegEx.Matches(htmlFile))
{
var group = match.Groups["URL"];
var url = group.Value;
}
Но происходит то, что я нашел совпадения из html-файла, но я получаю пустую группу захвата.
Почему бы не использовать подходящий html-парсер? – Jerry
Потому что в html-парсере в качестве входных данных требуется весь html-файл. Но у меня нет полного файла. У меня есть только фрагмент данных этого файла. Поэтому я не могу это использовать. –
Если ваш Html - xhtml, вы можете использовать XML-парсер .. это сработает для вас? – Mithon