2012-06-17 3 views
-8

Я разрабатываю приложение для Android, где на веб-сайте я программно отправляю данные в поле поиска и получаю результаты на Java.Чтение сайта Содержание Java

Я получаю данные с помощью URLConnect Java. Я получить исходный код т.е. HTML код ......

Urlconnection a = .connect to host 

getinputstream 

read data 

Я использую эти функции теперь, если сайт имеет содержание, как:

sahil 
3/5 patel chowk 
965955 

, так как эти детали будут внутри HTML-теги I хотите извлечь эту информацию. Есть идеи?

+0

решена проблема. спасибо большое –

ответ

2

Вы видели JSoup: http://jsoup.org/ его анализатор HTML должен делать то, что вам нужно.

+0

удивительный .. даже я слышал о JSON. wats dat –

+0

JSoup - это Java-библиотека для работы с реальным HTML. Он предоставляет очень удобный API для извлечения и управления данными, используя лучшие DOM, CSS и jQuery-подобные методы. –

0

в моей догадке, используя регулярные выражения в этом случае будет хорошо подходит для вас: How to use regular expressions to parse HTML in Java?

+0

, но поскольку страница очень большая. Мне нужно извлечь очень маленькую область. Чтобы перескакивать их dirct –

+0

с использованием библиотек, таких как @David, уже упоминалось, что он легко может содержать большую страницу в качестве входных данных. его разбор всей страницы для конкретного условия, которое вы дали парсеру в качестве входных данных. поэтому не беспокойтесь об этом. Просто взгляните на JSoup и образцы, представленные на странице. –

0

Использование JTiddy Легко использовать библиотеку Java для извлечения содержимого из HTML-страницы.

Смежные вопросы