Мне нужно извлечь некоторые данные с веб-страницы с помощью Jsoup.Получить текст без тегов с веб-страницы с помощью Jsoup
Я легко извлекал данные, содержащиеся в тегах, но мне все еще нужны некоторые данные, которые не помечены.
Это пример источника HTML:
<a id="aId" href="aLink" style="aStyle">
<span id="spanId1">
<b>Caldan Therapeutics</b>
Announces Key Appointments And A Collaboration With
<b>Sygnature Discovery</b>
</span>
<span id="spanId2" style="spanStyle2">
5/17/2016
</span>
</a>
Я уже извлекали данные, содержащиеся в <b>
тегов, а также дату, но то, что я хочу сейчас, чтобы извлечь предложение Announces Key Appointments And A Collaboration With
.
Как вы можете видеть, в этом предложении нет меток.
Что делать, чтобы извлечь его?
Я уже провел свое исследование, и все, что я мог найти, это как удалить все теги.
Благодарим за помощь!
Пожалуйста, следуйте этому сообщению http://stackoverflow.com/questions/12943734/jsoup-strip-all-formatting-and-link-tags-keep-text-only – shankarsh15
Я уже видел, что один и все, что он делает, это вырезать html-теги. Это не то, что я хочу. Я хочу извлечь только немаркированное предложение «Объявляет о ключевых встречах и сотрудничестве с» – user1885868