2013-07-09 1 views
0

Я использую регулярное выражение, чтобы помочь отфильтровать HTML в проекте локализации, который я не хочу переводить. Обычно я использую </?\w+((\s+\w+(\s*=\s*(?:".*?"|'.*?'|[^'">\s]+))?)+\s*|\s*)/?>, но содержание я перевод избежал символов в HTML, такие какRegex для сопоставления html-тегов с экранированными символами

<a href\="http\://www.fau.de/studium/zulassung/einschreibung/" target\="_blank"  title\="Externer Link auf die Webseite der FAU"> 

Может какая-то душа помочь мне решить, как соответствовать HTML-теги, содержащие косую черту, где они не должны действительно быть?

+1

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags?rq=1 –

+1

HTML - это * не * обычный язык. Не используйте регулярное выражение для анализа HTML. Используйте HtmlAgilityPack или другую библиотеку. – Amy

+0

Вам нужно использовать регулярное выражение? Regex - не лучший инструмент для HTML. Найдите парсер HTML. – StackOverflowNewbie

ответ

0

Я использовал '/ < (. | \ N) *?>/G'для соответствия всем тегам HTML в моем тексте, и это сработало для меня для игнорирования этого содержимого.

Смежные вопросы