2010-01-24 2 views
31

Что HTML парсеры имеют следующие характеристики:HTML/XML Parser для Java

  • Fast
  • поточно-
  • Надежный и ошибка свободного
  • Анализирует HTML и XML
  • Ручки ошибочными HTML
  • Имеет реализацию DOM
  • Поддерживает теги HTML4, JavaScript и CSS
  • Относительно простой, объектно-ориентированный API

Что парсер вы думаете, что лучше?

спасибо.

+2

что вы имеете в виду под "поддержка HTML4, JavaScript и CSS"? Парсер просто это, парсер, он не будет интерпретировать вашу страницу. Если вы хотите имитировать браузер, пожалуйста, перефразируйте свой вопрос. –

+0

Нет. Некоторые парсеры не понимают такие вещи, как CSS. Это то, что я имею в виду. – Shayan

+1

Если CSS находится в теге