2012-02-05 2 views
0

Я пытаюсь загрузить этот сайт: http://tnid.us/lookup/5705544911/WebClient показывает странные символы

и отфильтровать данные для того, чтобы получить «Original телефонная компания», и т.д., но он показывает эти данные, вместо того, что он должны быть показаны:

<p class="lt">Estimated Region:<br /><strong>&#80;&#101;&#110;&#110;&#115;&#121;&#108;&#118;&#97;&#110;&#105;&#97;</strong> 

Вместо:

Оценочное Регион:
P e n n s y l v a n i a

Есть ли способ, чтобы исправить/преобразовать его в .NET?

ответ

1

вы видите данные являются HTML encoded string of ascii values.

Я не знаю точно, но WebUtility.HtmlDecode может сделать трюк.

Если окажется, что декодированный контент содержит разметку ascii, то вы можете использовать WebUtility.HtmlEncode только те части разметки, которые представлены символами ascii.

1

Это HTML.

Вы ищете HTML Agility Pack.

+0

Интересно, спасибо. Из любопытства, нет абсолютно никакого способа, чтобы я мог сделать это прямо в .NET без внешних библиотек? –

+1

@Thomas: Если это полностью допустимый XHTML, вы можете использовать LINQ to XML ('XElement'). Если вы просто хотите обрабатывать объекты, вы можете вызвать 'WebUtility.HtmlDecode'. – SLaks

Смежные вопросы