2009-11-30 2 views
0

мы знаем, что все блога показать свой блог «s RSS фид,разбора приложений/атом + XML в HTML-страницу

<link rel="alternate" type="application/rss+xml" title="MyBlog RSS Feed" href="http://feeds.feedburner.com/MyBlog" /> 

, но вы знаете, любое регулярное выражение, чтобы получить feedurl от этого

<link rel="alternate" type="application/rss+xml" title="MyBlog RSS Feed" href="http://feeds.feedburner.com/MyBlog" /> 
+1

HTML. Ловкость. Упаковка. – bobince

ответ

6

Используйте такой запрос XPath, как этот:

//link[@type='application/rss+xml']/@href 

Он вытащит любой URL-адрес RSS-канала для вас. Никогда не анализируйте XML или HTML с регулярными выражениями.XPath специально разработан для удобного запроса XML и HTML. Он доступен практически в каждом стеке технологий, including .NET.

XML не является регулярным, и поэтому regex is the incorrect tool to parse it.

+0

+1 для XPath ... – alex

+0

Что делать, если html недействителен xml? – deerchao