У меня есть HTML-файл, содержащий некоторые теги java-скрипта. Когда я запускаю этот файл в каком-то браузере, таком как IE, некоторое содержимое кэшируется из его источника и отображается в браузере (например, погода некоторых городов). Как запустить запуск этого файла html
и получить содержимое веб-страницы, которое было показано в веб-браузере раньше? Я не хочу отображать содержимое в своем приложении; Я хочу проанализировать возвращенные данные и извлечь какое-то специальное содержимое (например, извлечь данные из каждого города). Может ли кто-нибудь мне помочь?java: get html contents
-1
A
ответ
1
То, что вы пытаетесь сделать, называется html scraping.
Ваш лучший вариант - получить помощь в виде библиотеки, поскольку это задание и сложная задача.
Смотрите этот вопрос: Options for HTML scraping?
0
Селен является хорошим выбором. Он поддерживает HtmlUnit, Firefox и Chrome среди других браузеров.
Ссылка: http://seleniumhq.org/
Смежные вопросы
- 1. Bookmarklet html contents (вместо get/request)
- 2. Facebook [function.file-get-contents]: не удалось открыть
- 3. В чем разница между Subclipse Get Contents и Get Revision?
- 4. file_get_contents() [function.file-get-contents]: Имя файла не может быть пустым
- 5. Разница между использованием .html() и .contents()
- 6. Mocking Files in Java - Mock Contents - Mockito
- 7. Jess printout contents print in Java
- 8. Файл-get-contents не удалось открыть поток Неавторизованный
- 9. обнаружение вызовов на внешний PHP (curl, file get contents ...)
- 10. PHP [function.file-get-contents]: Не удалось открыть поток
- 11. ADBannerView contents
- 12. Метод jquery .contents?
- 13. Reading Config File Contents
- 14. java swing get атрибут style div html
- 15. JQuery loop append contents
- 16. SyntaxError: Unterminated JSX contents
- 17. hidding div overflow contents
- 18. Пустое возвращение из JQuery .contents()
- 19. document.location.href получил javascript: window ["contents"]
- 20. Compare Large String Contents
- 21. LinearLayout fading effect contents
- 22. Encrypt Registry Contents
- 23. Unterminated JSX contents
- 24. Fit TitleWindow to contents
- 25. React: Unterminated JSX contents
- 26. Professional #include contents
- 27. facebook redirect url contents
- 28. SQL Unpivot Text Contents
- 29. Сортировка NSTableColumn contents
- 30. Echo out php contents
Этот вопрос слишком неконкретны, и как seeems, не имеет ничего общего с Java. Я вырезал тег 'java' – HerrSerker
Я хочу, чтобы приложение Java использовало его на сервере. Я получаю ввод и возвращает данные, полученные с сайта. Мне нужна библиотека java для анализа html-файла или содержимого, полученного с веб-сервера, и извлечения моих любимых тегов. Так что мой вопрос о java! – sajad