2013-06-01 5 views
1

Мне просто интересно, можно ли использовать сканер для чтения данных с веб-сайта. Это не обязательно текстовая веб-страница, но есть картинки, интерактивные ссылки и т. Д. Так что я могу только сканировать текст, а не что-то еще. Это приложение, и я буду читать имена, которые могут быть изменены. Вот почему я хотел бы прочитать их с веб-сайта, а не создавать свой собственный текстовый файл и читать его таким образом. Любая помощь будет большой. СпасибоСканирование данных с веб-сайта

+0

вам нужно будет сделать http-запрос запроса usin url и получить необходимые данные с сервера. Что вы скажете? – Raghunandan

ответ

1

Для этого вы должны использовать jsoup. Этот инструмент легко разобрать HTML-страницы.

Вы можете получить HTML-документ и могут перемещаться элементы, как указано здесь:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); 
Elements newsHeadlines = doc.select("#mp-itn b a"); 

Начало работы руководство просто узнать:

Getting started with JSoup

+0

Это похоже на лучшее решение. Я загрузил и поместил файл jar в папку libs. Хотя я не понимаю, как работает jsoup. Знаете ли вы какие-либо пошаговые руководства или другую информацию? – bigC5012

1

Вы можете использовать технику под названием Зачистка :

Web scraping

Смежные вопросы