Я использую Agility Pack для анализа HTML, следуя этому вопросу What is the best way to parse html in C#? и получаю отличные результаты :) Проблема возникает, когда я попадал на некоторые веб-страницы, результаты были основаны на моем местоположении, поэтому для например, как я в Испании, я получаю результаты для региона Испании, и я хотел бы изменить, как если бы я был в Англии, как это можно сделать? Я имею в виду, что мне нужно изменить в пользовательском агенте? (Я использую как пользовательский агент «Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv: xxx)» Gecko/20041107 Firefox/xx) «Настройки HTML Agility Pack
ответ
Вы можете использовать метод WebClient.DownloadString
, который позволяет вам установить заголовки HTTP-запросов для загрузки содержимого веб-страницы, а затем передать его в пакет гибкости HTML.
Пользователь UserAgent не является тем, что контролирует язык. Это заголовок Accept-Language
. Так, например:
using (var client = new WebClient())
{
client.Headers[HttpRequestHeader.AcceptLanguage] = "es-ES";
client.Headers[HttpRequestHeader.UserAgent] = "some user agent if you wish";
string html = client.DownloadString("http://example.com");
// feed the HTML to HTML Agility Pack
var doc = new HtmlDocument();
doc.LoadHtml(html);
// now do the parsing
}
Но если сайт использует распознавание на основе IP для отправки вам контента на разных языках существует не так много вы можете сделать на стороне клиента, чтобы изменить это.
Поиск по местоположению или страницы, как правило, выполняются через ip, или когда вы регистрируетесь, вы указываете сайт, на котором вы находитесь. вы можете захотеть заглянуть в прокси-сервер anon внутри страны, в которой вы хотели бы выглядеть так, как будто вы находитесь.
- 1. Cookies HTML Agility Pack?
- 2. HTML Agility Pack
- 3. Html Agility Pack Dll
- 4. Html Agility Pack C#
- 5. Html Agility Pack use
- 6. Html Agility Pack help
- 7. HTML Agility Pack Parsing
- 8. HTML Agility Pack & VB.NET
- 9. Html Agility Pack Xpath
- 10. Html Agility Pack Foreach Reverse
- 11. Продвинутое использование HTML Agility Pack
- 12. Html Agility Pack xPath issue
- 13. Html Agility Pack xpath IEnumerable
- 14. Html Agility Pack для python
- 15. HTML Agility Pack и LINQ
- 16. html agility pack удалить детей
- 17. HTML Agility Pack vs jquery
- 18. Html Agility Pack - новый HtmlAttribute
- 19. HTML Agility Pack для Delphi
- 20. Http agility pack xpath
- 21. Html Agility Pack: Найти комментарий Node
- 22. Получить HttpWebResponse от Html Agility Pack HtmlWeb
- 23. HTML Agility Pack не работает как ожидалось
- 24. C# HTML Agility Pack XPath Issues
- 25. «html agility pack» как модуль для perl
- 26. Html Agility Pack не может удалить узел
- 27. Html Agility Pack Пустые ценности из таблиц
- 28. HTML Agility pack - таблицы синтаксического анализа
- 29. Html Agility Pack C# Проблема parsing абзаца
- 30. Html Agility Pack messing с моим javascript
Я тоже использовал WebClient, а в содержимом html у меня есть -> lang = "es", поэтому вопрос в том, как я могу перейти на английский? – jobormo
Отлично! это то, что я хотел, не волнуйтесь, сайты не используют распознавание IP :) – jobormo