Мой HTML выглядит следующим образом:Как извлечь вес продукта из этого HTML
<td class="main"><b>Product Weight (2.83 lbs in 1 container)</b></td>
Мне нужно получить значение 2,83 из HTML.
Нужна помощь с регулярным выражением.
У меня есть это:
Pattern p = Pattern.compile(
"<td\\sclass=\"main\"><b>Product\\sWeight\\s\\s((?:\\d+\\.)?\\d+ \\w{3})");
Но, кажется, не работает.
Я пропустил бегство или что-то еще?
Update
Если скобки вопрос, я просто делаю (или на внутренних скобках также?
хорошего инстинкт, но ОП не пытаются разобрать HTML, дзю которые могут быть окружены тегами. – Etaoin
+1 на htmlparser, вы также можете посмотреть [jsoup] (http://jsoup.org) Также см. Много ответов на предупреждение SO о попытке использовать регулярное выражение для анализа HTML. –
Вы правы, если это единственное извлечение данных - все, что нужно сделать, настройка парсера будет немного переборщить. – Ham