Я использую cURL для захвата страницы, и я хочу разобрать заголовок сообщения (фактический текст, указанный в ссылке, а не атрибут title <a>
).Regex, чтобы разобрать заголовок сообщения
HTML, как это:
<li class="topic">
<a title="Permanent Link to Blog Post" rel="bookmark" href="http://www.website.com/blog-post/">Title of blog post</a>
</li>
Я попытался с помощью этого кода:
preg_match('/<\a title=\".*\" rel=\"bookmark\" href=\".*\">.*<\/a>/', $page, $matches);
Но это не работает, PHP возвращает Array ()
(пустой массив).
Может ли кто-нибудь предоставить мне регулярное выражение для этого? Я пробовал онлайн-генераторы, но это происходит прямо над моей головой. Ура!
Я думаю, что я где-то читал, что это была плохая идея для разбора HTML с использованием regex ... –
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-s Эльф-содержал-теги/1732454 # 1732454 – Ragepotato