Чтение сайта Содержание Java

-8

Я разрабатываю приложение для Android, где на веб-сайте я программно отправляю данные в поле поиска и получаю результаты на Java.Чтение сайта Содержание Java

Я получаю данные с помощью URLConnect Java. Я получить исходный код т.е. HTML код ......

Urlconnection a = .connect to host 

getinputstream 

read data

Я использую эти функции теперь, если сайт имеет содержание, как:

sahil 
3/5 patel chowk 
965955

, так как эти детали будут внутри HTML-теги I хотите извлечь эту информацию. Есть идеи?

источник

2012-06-17 Sahil Manchanda

решена проблема. спасибо большое –

Вы видели JSoup: http://jsoup.org/ его анализатор HTML должен делать то, что вам нужно.

источник

2012-06-17 15:18:34

удивительный .. даже я слышал о JSON. wats dat –

JSoup - это Java-библиотека для работы с реальным HTML. Он предоставляет очень удобный API для извлечения и управления данными, используя лучшие DOM, CSS и jQuery-подобные методы. –

в моей догадке, используя регулярные выражения в этом случае будет хорошо подходит для вас: How to use regular expressions to parse HTML in Java?

источник

2012-06-17 15:20:55

, но поскольку страница очень большая. Мне нужно извлечь очень маленькую область. Чтобы перескакивать их dirct –

с использованием библиотек, таких как @David, уже упоминалось, что он легко может содержать большую страницу в качестве входных данных. его разбор всей страницы для конкретного условия, которое вы дали парсеру в качестве входных данных. поэтому не беспокойтесь об этом. Просто взгляните на JSoup и образцы, представленные на странице. –

Использование JTiddy Легко использовать библиотеку Java для извлечения содержимого из HTML-страницы.

источник

2012-06-17 17:28:18 Sunny

Чтение сайта Содержание Java

ответ

Смежные вопросы