2013-11-19 3 views
0

Основываясь на заголовке, то, что я делаю сейчас, - это извлечение данных из HTML с помощью Java, который я сделал. Проблема заключается в том, данные я почерпнул содержит информацию, которая мне не нуженКак урезать предложение слов в определенном положении

Приведенное ниже часть HTML-кода, который я извлекая

<div class="postdetails"> 
Member Group: Junior Member<br /> 
Joined: Mar 2010 
</div> 

Выходной сигнал теперь я получаю сейчас Member Group: Junior Member Joined: Mar 2010 который обе линии.

Что я хочу, это часть Mar 2010. Могу ли я узнать, как я могу урезать предложение?

Ниже часть моего Java-кода на извлечение данных

Elements joinDate = doc.select("div.postdetails"); 

System.out.println(joinDate.text()); 
+1

1. String [] arr = String.split (":"). 2. Используйте arr [2] .trim(). – TheLostMind

+1

@ X86 С простой модификацией кода, который вы мне даете, мне удалось его получить. Благодарю. – user273371

+0

Возможно, использование 'joinDate.text()' не самый лучший вариант? Я не знаю, какие другие методы может иметь класс 'doc', но я уверен, что у него должен быть метод для получения всех дочерних узлов, поэтому в основном вы ищете третий дочерний узел (текст' Регистрация: Mar 2010'), а затем вы захотите получить свойство '.text()' этого узла и разделить его, как говорили другие. Хотя их решение, похоже, работает в этом конкретном случае, оно не поддерживается и может сломаться в будущем. – stackular

ответ

0

Предполагая, что вы хотели текст после последнего «:», то вы можете использовать

var n = str.lastIndexOf(":"); 

, а затем использовать str.substr(n)

Смежные вопросы