Я пытаюсь очистить CMS, введенный в HTML, который имеет посторонние теги абзацев и теги br везде. Жесткость Sanitize оказалась очень полезной для этого, но я застрял в особой проблеме.Sanitizing HTML с помощью Nokogiri
Проблема заключается в том, когда есть уш тег непосредственно после/до пункта тег, например
<p>
<br />
Some text here
<br />
Some more text
<br />
</p>
Я хотел бы вычистить посторонние первые и последний BR тег, но не средний.
Я очень надеюсь, что смогу использовать трансформатор санитарии, чтобы сделать это, но не может найти подходящего помощника для достижения этого.
Любая помощь будет высоко оценена.
Я не знаком с дезинфицировать, но '/
(. *)
/'будет соответствовать средней части без ведущих тэгов'
'. – engineersmnky
Не используйте регулярное выражение для управления HTML. Это слишком хрупкое решение. –
И вам действительно нужно показать нам, что вы пробовали. Это позволяет нам знать, что вы хотите знать, как ловить рыбу, а не просто просить об этом. –