Я использовал Кобру до сих пор из-за того, насколько это было легко, но, к сожалению, у нее была проблема с несколькими тестовыми случаями. Кто-нибудь предлагает испытанную библиотеку?Любые хорошие парсеры Java HTML?
Я пробовал использовать Cobra в одном и HTMLCleaner без везения.
Судя по вашему последнему вопросу, проблема заключается не в «оценщике XPath». Вы использовали 'XPathFactory.newInstance()', который создает оценщик Java, который работает на любом документе XML, загруженном в DOM-модель (в качестве экземпляра 'Document'). Сам CORBA не является оценщиком XPath - это парсер HTML, который создает «Документ», и в этом случае он сделал это неправильно. Так что вы действительно хотите, это «хороший Java-парсер Java», а не «хороший оценщик Java XPath». –
К сожалению ... извините. Я пересмотрел свой вопрос ... Я просто схожу с ума со всем HTML перед глазами ... – Legend
Я уверен, что этот же вопрос был на SO ранее на этой неделе ... – DisgruntledGoat