XML - это грамматика; регулярные выражения - не лучшие инструменты для работы с грамматиками.
Мой совет будет работать с реальным анализатором для работы с DOM, а не делать матчей
Например, если у вас есть:
<xml>
<items>
<myItem>
<tagtoRemove>something1</tagToRemove>
</myItem>
<myItem>
<tagtoRemove>something2</tagToRemove>
</myItem>
</items>
Регулярное выражение может попытаться соответствовать его (из-за жадный механизм)
<xml>
<items>
<myItem>
matchString
</myItem>
</items>
Кроме того, некоторые использует, что некоторый DTDs может позволить (например, <tagToRemove/>
или <tagToRemove attr="value">
) делают улавливающие тег с регулярными выражениями мо трудно.
Если вам не ясно, что ни одно из вышеперечисленных не может произойти (или в будущем), я бы пошел с парсером.
Если у вас есть что-то другое, кроме самого простого, не вложенного xml, регулярное выражение не будет работать. –