2010-04-27 3 views
0

Мой HTML выглядит следующим образом:Как извлечь вес продукта из этого HTML

<td class="main"><b>Product Weight (2.83 lbs in 1 container)</b></td> 

Мне нужно получить значение 2,83 из HTML.

Нужна помощь с регулярным выражением.

У меня есть это:

Pattern p = Pattern.compile(

    "<td\\sclass=\"main\"><b>Product\\sWeight\\s\\s((?:\\d+\\.)?\\d+ \\w{3})"); 

Но, кажется, не работает.

Я пропустил бегство или что-то еще?

Update

Если скобки вопрос, я просто делаю (или на внутренних скобках также?

ответ

2

Похоже, вы пропустили побег из буквального скобки.

1

для получения конкретных HTML-тегов Я рекомендую HTML-парсер над Regex. Вы можете, например, использовать this HTML-парсер.

+0

хорошего инстинкт, но ОП не пытаются разобрать HTML, дзю которые могут быть окружены тегами. – Etaoin

+0

+1 на htmlparser, вы также можете посмотреть [jsoup] (http://jsoup.org) Также см. Много ответов на предупреждение SO о попытке использовать регулярное выражение для анализа HTML. –

+0

Вы правы, если это единственное извлечение данных - все, что нужно сделать, настройка парсера будет немного переборщить. – Ham

Смежные вопросы