2011-09-18 5 views
0

Я хочу использовать jsoup, чтобы разобрать средний текст, рассказывающий вам о названии.как разобрать конкретный текст?

http://www.upcominggames.com/2113/Halo+Combat+Evolved+Anniversary/ http://www.upcominggames.com/478/Gears+of+War+3/

Что бы теги jsoup быть, чтобы разобрать это и извлечь только статью?

Что было бы общим селектором для двух статей выше?

EDIT:

Что я хочу сделать, это разобрать эту часть

Gears Of War 3 Факты
Gears войны 3 является шутером от третьего лица, опубликованные Microsoft и разработанный Epic Games, а его   будет выпущен 20 сентября 2011 года в США, Австралии и Европе, а 22 сентября в   Японии.

Gears Of War 3 Синопсиса
Это Xbox 360 эксклюзивного вывод Шестерни войны трилогии Gears войны 3 места игроков в   середине захватывающего опыта и истории выживания, надежд и братства. Этот шутер от третьего лица   значительно ведет игроков через захватывающий мир с большим количеством цвета и деталей, чем когда-либо прежде. Кроме того, его захватывающий многопользовательский режим приведет к тому, что игроки захотят больше даже после того, как они закончат кампанию.

Gears Of War 3 Gameplay
Любой, кто играл Gears игры War будет чувствовать себя знакомым, когда они играют Gears Of War 3, но   это не означает, что они не будут сталкиваться с несколько новых удивлены. Окружающая среда намного больше   подробная и захватывающая, добавив к волнению и острым ощущениям, что франшиза Gears of War известна.   Благодаря наличию большего количества врагов, чем предыдущие партии серии Gears of War, Gears of War 3 будет   предлагать игрокам новую задачу, поскольку они пытаются спасти человечество от полного уничтожения. Если у   игроков есть 3D-телевизор, они смогут сыграть этот новый взнос в 3D, чтобы полностью погрузиться в игру  .

Gears Of War 3 Мультиплеер
мультиплеер дополнения к Gears войны 3 делает игру большой шаг от Gears войны 2. Начиная   с выделенными серверами для обработки сватовства, Epic Games поставил много усилий по созданию этого   лучший инструмент Gears. С помощью Capture the Leader, King of the Hill и других многопользовательских режимов игроки   смогут играть в онлайн-игры с другими игроками в захватывающих deathmatches.

Я хочу проанализировать выделение жирным шрифтом в отдельном текстовом элементе, а затем под ним я хочу загрузить его содержимое. В основном, как это выше.

Если вы блика текст и нажмите Выбор источника просмотра вы увидите, что я пытаюсь разобрать

Я знаком с jsoup.Просто нужна помощь по этой части.

+0

"разобрать средний текст говорит вам о названии", - не могли бы вы объяснить немного больше что вы пытаетесь сделать здесь? –

+0

Отредактировано мое редактирование –

+0

У вас есть то, что я говорю сейчас? –

ответ

2

Да, я понимаю, что вы говорите. Я думаю, что Jsoup легко извлечет это, если вы изучите исходный код веб-страницы и найдете общие теги и атрибуты ссылок. Те, чтобы попробовать включают:

  • получить элементы, которые имеют тег «ДИВ»
  • атрибут «идентификатор», который присваивается «игра-DESC»

Текст вернулся из только эти два фильтры, скорее всего, доставят вам то, что вы хотите.

например,

Edit: код упрощен, чтобы использовать выбора (...)

import java.io.IOException; 
import java.util.ArrayList; 
import java.util.List; 

import org.jsoup.Jsoup; 
import org.jsoup.nodes.Document; 
import org.jsoup.nodes.Element; 
import org.jsoup.select.Elements; 

public class HaloStuff { 
    private static final String TEST_URL_1 = "http://www.upcominggames.com/" + 
     "2113/Halo+Combat+Evolved+Anniversary/"; 
    private static final String DIV_TAG = "div"; 
    private static final String ID_ATTR = "id"; 
    private static final String GAME_DESC = "game-desc"; 

    public static void main(String[] args) { 
     Document jsDoc = null; 

     List<String> textList = new ArrayList<String>(); 

     try { 
     jsDoc = Jsoup.connect(TEST_URL_1).get(); 

     Elements textEles = jsDoc.select("div[id=game-desc]"); 
     for (Element ele : textEles) { 
      System.out.println(ele.text()); 
     } 

     } catch (IOException e) { 
     e.printStackTrace(); 
     } 
    } 
} 
+0

Perfect .. Хорошо, поэтому я понимаю jsoup намного лучше от вашего фрагмента кода! Большое спасибо. Также как я могу отформатировать полужирные части, чтобы они были там, там есть собственный текст и содержимое статьи под каждым жирным разделом? как в статье на гало. –

+0

«Это остается как упражнение для читателя». Другими словами, попробуйте сами, так как это не сложно. Играйте с вашим кодом. –

+0

Хорошо, спасибо большое. Я уверен, что смогу понять это. С вашей помощью это будет быстрее. лол –

2

Вы просто должны быть в состоянии сделать это с:

div#game-desc p 

Что вы пробовали, что не работает?

Смежные вопросы