У меня есть регулярное выражение, которое проходит через теги html и захватывает значения. В настоящее время у меня есть это, чтобы захватить все значения в теге.Регулярное выражение для исключения строки?
<title\b[^>]*>(.*\s?)</title>
Он отлично работает. Так что, если у меня есть куча страниц, которые имеют названия:
<title>Index</title>
<title>Artwork</title>
<title>Theory</title>
Возвращаемые значения: Index, Произведение, Теория
Как я могу сделать это регулярное выражение игнорировать все теги со значением Теория внутри них?
Заранее спасибо
См http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contains-tags/1732454 # 1732454 – BrunoLM
Любая конкретная причина, по которой вы хотите сделать это только с регулярным выражением? Это действительно не очень хорошо подходит для синтаксического разбора HTML. – zigdon
Да, есть особая причина. Я просто сказал html, чтобы он был простым, но это действительно для программы, которая захватывает XML-данные и вставляет их в базу данных. – Ricky