У меня есть программа в C#
, которая извлекает некоторые данные из базы данных. Данные могут содержать теги html
. К сожалению, в некоторых случаях тег html закрытия LAST отсутствует символ «>».Обнаружить наличие неправильного тега HTML и исправить его
Может ли кто-нибудь помочь мне найти решение для проверки этого экземпляра неправильного html, а затем добавить конечный символ «>».
спасибо.
--- EDIT ---
Я думал о решении проблемы таким образом:
- Проверки для последнего совпадения
</tag
- Проверьте, если символ после его>
- Если нет, добавьте>
Однако, я не знаю, что регулярное выражение, я должен нам e при 1). У кого-нибудь есть идея. Я не очень хорошо разбираюсь в регулярном выражении.
--- EDIT --- Ниже приведены некоторые примеры данных, я мог бы иметь:
hello <span class=green>Sean</span> Moore
hello <span><span class="green">Roger</span></span
http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html – Aron
У вас есть что отсутствует '>' только на последнем теге, а также в середине html-текста (по другим тегам)? –
Он всегда находится в последнем теге. Однако этого не происходит для всех данных. – user3172468