2011-05-06 1 views
0

Я начинаю новый проект, с которым я никогда не пытался работать на Java, и я изучал его раньше. Мои исследования не привели меня куда дальше, чем я начал.Java - Получить текст с веб-страницы

В основном мой проект будет делать это:

  • Поиск веб-сайт и получить соответствующие данные (в основном поиска своей поисковой системы на основе запроса , что пользователь вводит, а затем возвращает соответствующие результаты)

  • в пользователь нажимает на один из результатов , а затем программа будет показывать определенные
    значения (значения будут на 0 Веб-страница Результат в)

До сих пор все, что я вроде знаю о том, как сделать это Web Зачистка. Я не мог найти никаких примеров, поэтому я все еще в темноте об этом.

Действительно ли это возможно? Я буду использовать Java с Android SDK. Я вроде есть идея, но мой Java знание не содержит ничего общего с веб-страниц и т.д.

Благодаря передовой, Brandon

ответ

1

Nutch - отличный инструмент, но может быть немного излишним для небольшого проекта. если вы ищете что-то действительно быстрый и грязный, и легко понять, вы должны смотреть в crawler

увидеть пример использования здесь: http://java.net/projects/crawler/sources/svn/content/trunk/src/examples/com/torunski/crawler/examples/ExampleDownloadWithHTMLParser.java?rev=429

Вы можете, вероятно, падение это в свой проект и быть соскоб в 10 минут

+0

Спасибо за информацию. Посмотрите на них обоих – Brandon

0

Конечно, это возможно. Вероятно, лучшая библиотека для этого - Apache Nutch. Он основан на мощных библиотечных стеках, таких как Lucene, и очень зрелый. Посмотрите на их учебники, и вы можете найти всю необходимую информацию для быстрой работы.

Смежные вопросы