2011-12-14 2 views
0

Можно создать дубликат:
Regex to match all HTML tags and tag content except <p> and </p>
RegEx match open tags except XHTML self-contained tagsRegex чтобы соответствовать всем HTML-теги, кроме <p>и</p> в C#

У меня есть текстовый редактор, и он принимает все HTML свойство, как пролете , div, цвет шрифта, имя шрифта, размер. Поэтому я хочу удалить все теги HTML и сохранить Tag Tag и Break Tag.

+0

Вы ожидаете, что HTML-сообщение будет иметь одинаковый формат все время или будет очень переменным? – Oded

+5

Как всегда: http://stackoverflow.com/a/1732454/572644 –

+3

Несомненно менее поэтический, но, вероятно, более понятный в объяснении: [этот другой] (http://stackoverflow.com/q/6751105/146792). – mac

ответ

0

Отрицание в регулярном выражении - очень сложная вещь. Существует способ свести на нет группу: (?!somepattern), но он не поддерживается всеми языками, и при его поддержке вы должны быть осторожны.

Мой совет будет для вас просто соответствовать всем тегам: <.*?>. Затем на языке, который вы программируете (этот случай - C#), повторяйте результаты и удалите те, которые не соответствуют <p> или </p>.

Не всегда регулярные выражения - лучший способ решить проблемы.

Смежные вопросы