Это стало настоящей болью на моей стороне.Исключение несогласованного тега при разборе XML
URL, я пытаюсь разобрать это http://torrentz.eu/feed_verifiedP?q=ubuntu
Вот короткая версия XML:
<?xml version="1.0"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>Torrentz - ubuntu</title>
<link>http://torrentz.eu/verified?q=ubuntu</link>
<description>ubuntu search</description>
<language>en-us</language>
<atom:link href="http://torrentz.eu/feed_verifiedP?q=ubuntu" rel="self" type="application/rss+xml" />
<item>
<title>ubuntu 11 10 desktop i386 iso</title>
<link>http://torrentz.eu/8ac3731ad4b039c05393b5404afa6e7397810b41</link>
<guid>http://torrentz.eu/8ac3731ad4b039c05393b5404afa6e7397810b41</guid>
<pubDate>Thu, 13 Oct 2011 15:02:06 +0000</pubDate>
<category>apps linux applications os software</category>
<description>Size: 695 MB Seeds: 4,613 Peers: 161 Hash: 8ac3731ad4b039c05393b5404afa6e7397810b41</description>
</item>
</channel>
</rss>
Мой код:
SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser sp = spf.newSAXParser();
XMLReader xr = sp.getXMLReader();
//Get Torrents
XMLTorrentsRSSHandler torrentsHandler = new XMLTorrentsRSSHandler();
xr.setContentHandler(torrentsHandler);
InputStream in = url.openStream();
xr.parse(new InputSource(in));
XMLTorrentsRSSParsedDataSet parsedTorrentsDataSet = torrentsHandler.getParsedData();
я получаю это исключение:
org.apache.harmony.xml.ExpatParser$ParseException: At line 1, column 53: mismatched tag
Почему флип меня так мучает !?
EDIT: Этот метод работал нормально до сегодняшнего дня. Возможно, веб-сайт изменился, но где этот яркий тег flippin?
Вы можете попробовать DomParsing вместо саксофона. Проверьте эту ссылку http://www.coderanch.com/t/489237/XML/Dom-Parser-special-character – kosa
Я знаю, что вы сказали, что он только начал работать снова, - но вы когда-нибудь выяснили, в чем проблема? ? – Dave