Я пытаюсь создать сценарий, который поможет мне получить новые книги с веб-сайта.Regex и числовое значение для захвата между двумя разными тегами
Я работаю с preg_match_all. У меня есть 7 информации, чтобы получить: название, автор, редактор ...
У меня возникла проблема с созданием маски соответствия. Например, мне нужен код продукта. Для каждой страницы есть от 3 до 10 продуктов кода. :
<li><label>Réf : </label>21608</li>
Сначала я пытаюсь это:
$mask ="/Réf :(.*)<\/li>/Us";
Это работа, но я хочу только цифры. Я ищу справочники регулярных выражений в Интернете, но я не понимаю, как использовать синтаксис для моей цели, потому что этот продукт кода не существует между двумя тегами: <open>...</open>
. Этот код продукта имеет 4 или 5 номеров.
Спасибо за помощь!
Если вы пытаетесь разобрать XML/HTML, это почти всегда лучше использовать реальный анализатор, а чем пытаться использовать регулярное выражение. –
См. Также: http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags –