В последнее время я использую HttpWebRequest/HttpWebResponse, и у меня возникают проблемы с кодированием. HttpWebResponse.CharacterSet не всегда представляет собой реальную кодировку страницы, поэтому я решил использовать метатег Content-Type.Обнаружение кодировки HttpWebResponse
- Как я могу прочитать метатег Content-Type, если я не могу даже декодировать ответ (в случае неправильного заголовка http-символов CharacterSet)?
- Есть ли решение с открытым исходным кодом, которое будет автоматически обрабатывать кодировку страницы и может загрузить источник URL-адреса, например браузер?
Обратите внимание, что мне не нужны причудливые методы, такие как алгоритмы обнаружения набора символов, просто базовые вещи, такие как обнаружение на основе заголовков HTTP или элементов метатега.
Заранее спасибо.
Спасибо! Мне, возможно, придется немного подкорректировать его, но у меня есть концепция. – James
Пожалуйста, не отправляйте ссылки только на ответы. – holmis83