2012-04-04 4 views
-1

У меня есть HTML-файл, содержащий некоторые теги java-скрипта. Когда я запускаю этот файл в каком-то браузере, таком как IE, некоторое содержимое кэшируется из его источника и отображается в браузере (например, погода некоторых городов). Как запустить запуск этого файла html и получить содержимое веб-страницы, которое было показано в веб-браузере раньше? Я не хочу отображать содержимое в своем приложении; Я хочу проанализировать возвращенные данные и извлечь какое-то специальное содержимое (например, извлечь данные из каждого города). Может ли кто-нибудь мне помочь?java: get html contents

+0

Этот вопрос слишком неконкретны, и как seeems, не имеет ничего общего с Java. Я вырезал тег 'java' – HerrSerker

+0

Я хочу, чтобы приложение Java использовало его на сервере. Я получаю ввод и возвращает данные, полученные с сайта. Мне нужна библиотека java для анализа html-файла или содержимого, полученного с веб-сервера, и извлечения моих любимых тегов. Так что мой вопрос о java! – sajad

ответ

1

То, что вы пытаетесь сделать, называется html scraping.

Ваш лучший вариант - получить помощь в виде библиотеки, поскольку это задание и сложная задача.

Смотрите этот вопрос: Options for HTML scraping?

0

Селен является хорошим выбором. Он поддерживает HtmlUnit, Firefox и Chrome среди других браузеров.

Ссылка: http://seleniumhq.org/

Смежные вопросы