2010-03-18 4 views
1

В последнее время я использую HttpWebRequest/HttpWebResponse, и у меня возникают проблемы с кодированием. HttpWebResponse.CharacterSet не всегда представляет собой реальную кодировку страницы, поэтому я решил использовать метатег Content-Type.Обнаружение кодировки HttpWebResponse

  1. Как я могу прочитать метатег Content-Type, если я не могу даже декодировать ответ (в случае неправильного заголовка http-символов CharacterSet)?
  2. Есть ли решение с открытым исходным кодом, которое будет автоматически обрабатывать кодировку страницы и может загрузить источник URL-адреса, например браузер?

Обратите внимание, что мне не нужны причудливые методы, такие как алгоритмы обнаружения набора символов, просто базовые вещи, такие как обнаружение на основе заголовков HTTP или элементов метатега.

Заранее спасибо.

ответ

2

Я использовал this решение. Оно работает.

+0

Спасибо! Мне, возможно, придется немного подкорректировать его, но у меня есть концепция. – James

+0

Пожалуйста, не отправляйте ссылки только на ответы. – holmis83

Смежные вопросы