Итак, я пытаюсь извлечь все ссылки с главной страницы google с помощью регулярных выражений.регулярное выражение, возвращающее ничего
Но я столкнулся с непонятной проблемой. Когда я отправляю запрос на главную страницу google и пытаюсь извлечь все ссылки со страницы, я обычно получаю один результат, а отдых - мусор. Однако, когда я вручную просматриваю источник страницы и извлекаю некоторую ссылку для тестирования против шаблона, он работает.
Теперь я не знаю, что здесь не так. Я думаю, что мой шаблон ошибочен, я стараюсь понять его правильно или, возможно, Google отправляет разные ответы на мой код и браузер. Я очень благодарен, если я получу некоторое понимание этой проблемы.
Мой рисунок
string pattern = @"=("")?(https?:\/\/)?[\w.-]+\.[\w]*([/]?[\w]*)*("")?";
Мой код дисплей
Match match = Regex.Match(source, pattern);
if (match.Success)
{
foreach (var res in match.Groups)
{
Console.WriteLine(res);
}
Console.ReadKey();
}
Нам нужно содержимое 'source' ... –
Поместите контрольную точку в свой код и извлеките любые данные, прикрепленные к' source', Посмотрите, что именно Google показывает вашу программу. – Logarr
хорошо, что это будет весь источник главной страницы google, не уверен, что это подходит для сообщения. –