2013-02-10 3 views
0

Я пытаюсь разобрать http://www.wein-wg.de/wwg/rheinhessen/worms-pfeddersheim/weingut-goldschmidt/, но не могу получить правильную кодировку. На сайте используется iso-8859-1. Как-то все символы Юникода отображаются как? в Visual Studio.Неверное кодирование с помощью HTML Agility Pack

Есть ли возможность перенести его в правую кодировку в Visual Studio или где-нибудь еще?

ответ

0
using HtmlAgilityPack; 

HtmlDocument doc; 
HtmlWeb web = new HtmlWeb(); 

private void getPage(string url) 
{ 
    web.OverrideEncoding = Encoding.GetEncoding("iso-8859-1"); 
    doc = web.Load(url); 
    webBrowser1.DocumentText = doc.DocumentNode.OuterHtml; 
} 

getPage("http://www.wein-wg.de/wwg/rheinhessen/worms-pfeddersheim/weingut-goldschmidt/"); 
0

решена с:

 HtmlWeb Webget = new HtmlWeb(); 
     HtmlDocument doc = new HtmlDocument(); 
     Webget.AutoDetectEncoding = false; 
     Webget.OverrideEncoding = Encoding.UTF8; 

     doc_tmp.OptionOutputAsXml = true; 
     doc_tmp.OptionReadEncoding = true; 
     doc_tmp.OptionFixNestedTags = true; 
     doc_tmp.OptionDefaultStreamEncoding = Encoding.UTF8; 

       doc_tmp.LoadHtml(tmp.InnerHtml); 
       doc_tmp.Save(Console.Out);