Я разбираю некоторый HTML, и мне нужно получить все html в теге body. Моя целевая строка всегда будет выглядеть примерно так:Безопасное использование Regex для этого? (HTML)
<body><div><img src="" />text etc</div></body>
Однако, мне просто нужно:
<div><img src="" />text etc</div>
Моя целевая строка всегда будет начинаться и заканчиваться с этими тегами тела. Тем не менее, есть повторное предупреждение о том, что Regex не использует для анализа HTML, но у меня нет никаких жизнеспособных решений для этого, кроме Regex на данный момент.
Вопрос: Есть ли безопасный Regex (ы) для использования в этом случае? Или я должен просто забыть об этом?
Что на самом деле означает «У меня нет никаких жизнеспособных решений для этого, кроме того, что Regex на данный момент» означает? Почему у вас нет жизнеспособных решений? Разве не лучше было бы * получать * жизнеспособные решения вместо использования нежизнеспособного *, который, как вы знаете, нежизнеспособен *? –
Вы звучите как моя логика и учитель риторики. Но да, вы правы. Решение, которое я использую на данный момент, является проблемой, но это лучший, который у меня есть сейчас. DOM Parser, который я использую, возвращает innerHTML элементов с собственными тегами элемента без изменений, что означает, что он возвращает элемент в целом, а не только HTML внутри. Мне нужно Regex, чтобы извлечь из этого внутреннее. – mattsven