Я разборе некоторые таблицы с веб-сайта, а именно я пытаюсь извлечь следующие клетки от имени класса:Jsoup: Выбор элементов, которые имеют один класс
<td class=" text_bold">example</td>
я использую стандартный селектор Jsoup для извлечения теги с классом, следующим образом:
Elements cells = doc.select("td.text_bold");
проблема заключается в том, что существует и другие клетки, которые также выбраны потому, что они имеют как text_bold
класса и другой класс, например:
<td class="text_bold text_align_left" valign="top" width="150">example</td>
Есть ли простой способ фильтрации только элементов, которые имеют один класс, как указано в методе select()
?
Попробуйте 'doc.select ("тд [класс = 'text_bold']")'. – Vulcan
@ Vulcan Спасибо за предложение. Похоже, что он должен работать с '[attribute = value]', но он возвращает 0 элементов. – ashatte
Есть ли место до или после 'text_bold', но все еще в объявлении класса? Если это так, вы можете использовать '^ =' для startsWith, '$ =' для endsWith или если пробелы находятся с обеих сторон и/или являются несогласованными, используйте селектор регулярных выражений '~ ='. – Vulcan