2010-03-02 6 views
0

Я использую это, чтобы загрузить страницу HTML с помощью XMLЗагрузка HTML страницы, как XML

Dim xmlDoc As New XmlDocument() 
xmlDoc.Load(Server.MapPath("index.htm")) 

Или

Dim xmldoc As XDocument 
xmldoc = XDocument.Load(Server.MapPath("index.htm")) 

, но я получил некоторые ошибки, такие как:

  • Expecting an internal subset or the end of the DOCTYPE declaration. Line 2, position 14;
  • '>' is an unexpected token. The expected token is '"' or '''. Line 1, position 62;
  • Expecting an internal subset or the end of the DOCTYPE declaration. Line 5, position 20.

Все эти ошибки приходят ко мне, когда я решаю один, появляется еще один.

Я спрашиваю, могу ли я использовать идеальный способ загрузить этот файл или есть другой способ для этого?

+0

1. На каком языке это? 2. Вероятно, это просто искаженный HTML; вам сначала нужно запустить что-то вроде http://tidy.sourceforge.net/. – Matchu

+0

его vb.net lang. –

ответ

6

Используйте HTML Agility Pack для анализа HTML-документов.

Это библиотека .NET, которая анализирует файлы HTML. Парсер очень толерантен с искаженным HTML-кодом «реального мира». Объектная модель очень похожа на System.Xml.XmlDocument, но для HTML-документов. Он поддерживает XPath и XSLT.

Dim htmlDoc As New HtmlDocument() 
htmlDoc.Load(Server.MapPath("index.htm")) 
Смежные вопросы