2013-05-05 5 views
0

Я получаю (HTTP запрос), и я пытаюсь получить некоторые данные из него с помощью регулярных выражений, например, эта часть HTML:Regex данные HTML теги

<tr><th>Continent:</th><td class='trc'>Europe (EU)</td></tr> 

Как я могу вывести «Европу (ЕС)» из этого?

Я попытался это регулярное выражение:

/<th>Continent:<\/th><td class='trc'>(.+)\s<\/td>/ 

Но это не работает

+0

Какой язык ?. – Maroun

+4

Вы не должны использовать регулярные выражения для анализа HTML. Используйте синтаксический анализатор HTML для этого ... – plalx

+0

http://stackoverflow.com/q/1732348/139010 –

ответ

2

Вы рассказываете регулярное выражение для поиска пространства с последующим </td>

/<th>Continent:<\/th><td class='trc'>(.+)\s<\/td>/ 
             ^^ 

Я бы рекомендуется использовать [^<>]+ для поиска текста между тегами html.

/<th>Continent:<\/th><td class='trc'>([^<>]+)<\/td>/ 
Смежные вопросы