У меня есть контент, содержащий контент вместе с HTML-тегами внутри контента. Я пытаюсь определить <ins></ins>
и <del></del>
с условиями, указанными в образеКоррекция в регулярном выражении
http://i.stack.imgur.com/8iNWl.png
регулярное выражение https://regex101.com/r/cE4mE3/30
Это происходит сбой только в одном случае, то есть когда там HTML теги или специальный символ внутри <ins></ins>
его неправильная идентификация. В приведенном выше регулярном выражении есть </ins></ins>
внутри другого <ins></ins>
и, следовательно, он разбивается до начала открытого тега <ins>
. Идентификация регулярного выражения должна останавливаться только тогда, когда есть полный стоп или запятая или пробел между <ins></ins>
. Но если есть какой-либо тег HTML или другой тег <ins></ins>
внутри другого <ins></ins>
, идентификация должна быть продолжена.
В приведенном выше регулярное выражение группы, которые должны быть выбраны в
1. <ins class="ins">ff</ins><del class="del">C</del>om<del class="del"> </del><ins class="ins"><ins class="ins">g</ins></ins><del class="del"> g</del>gp<del class="del">a</del>n<del class="del">y</del>
и
2. test<del class="del">test</del><ins class="ins">tik</ins><del class="del">peop</del>man<del class="del"> </del></i><del class="del"> g</del>gp<del class="del">a</del>n<del class="del">y</del>
Но есть HTML-теги между идентификацией останавливается рядом с HTML-тега в 1 и 2 групп.
Разве я не видел этот вопрос repeatetly отвечал с разными разными счетами? –
Содержание может быть таким же, потому что все, что он содержит, это и
теги, но вопрос о другом – RajithaМожете ли вы упростить объяснение того, что вы пытаетесь сопоставить или заменить? – sln