Я пытаюсь получить итоговое содержимое веб-страницы, чтобы извлечь текст. Я попытался использовать код ниже, но он получает мне исходный html, а не полученный html.Получить вывод веб-страницы в C#
string urlPath = "http://www.cbsnews.com/news/jamar-clark-protests-follow-decision-not-to-file-charges-in-minneapolis-police-shooting/";
WebClient client = new WebClient();
string str = client.DownloadString(urlPath);
Сравните текст в переменной ул с HTML в Инструменты разработчика в браузере Chrome, и вы получите разные результаты.
Любые рекомендации будут оценены.
И вопрос .......? –
Хромированный HTML-код не только извлекает его. Это означает обращение с особыми символами, новыми символами и т. Д. Что именно вы пытаетесь сделать? То, что вы видите, вероятно, ближе к «View Page Source» ** edit ** Также javascript, который выполняется на странице, загружаемые iframe и многое другое, может изменить отображаемый html по сравнению с источником, поэтому он, вероятно, никогда не будет быть точным anyways – Matt
И вопрос: «Как получить текст, отображаемый в браузере через C#». – Garagewerks