2010-05-28 3 views
0

Я экранирую веб-сайт, который находится на датском языке .. Я не могу царапать некоторых персонажей, как må .. любая идея, чтобы решить эту проблему? спасибоЭкран соскабливания

+2

Вы покажете нам соответствующий код, который вы используете для очистки содержимого? –

+1

Какую библиотеку/код вы используете для очистки? –

+0

Я не пользуюсь библиотечными файлами .. Я просто использую regex – SAK

ответ

0

я просто использовал System.Web.HttpContext.Current.Server.HtmlDecode() он работает ..

1

Попробуйте кодировку UTF-8 или Windows-1252.

+0

спасибо ..и попробовал....в сайте есть "windows-1252" кодировка – SAK

0

Если вы используете элемент управления веб-браузера, вы можете установить кодировку страницы на любой язык, который может отображать этот символ. Затем просто извлеките источник страницы.

0

Я использую ISO-8859-1 для декодирования. HTH

0

Лучше использовать ту же кодировку, что и объект HttpWebResponse, Ниже приведен код, который будет работать со всеми langauges и символами.

 response = (HttpWebResponse)request.GetResponse(); 
     string Charset = response.CharacterSet; 

     Encoding encoding = Encoding.GetEncoding(Charset); 

     if (response.StatusCode == HttpStatusCode.OK) 
     { 
      response_stream = new StreamReader(response.GetResponseStream(), encoding); 

      html = response_stream.ReadToEnd(); 
     } 
Смежные вопросы