Можно создать дубликат:
RegEx match open tags except XHTML self-contained tagsRegex Синтаксический HTML
Я хотел бы, чтобы гарантировать, что HTML атрибуты имеют кавычки вокруг них, как требуется XHTML.
Например:
<BODY link=#0000ff vLink=#800080>
должен быть
<BODY link="#0000ff" vLink="#800080">
Ищу шаблон Regex, что бы справиться с этим.
Благодаря
Parsing Html Cthulhu Way, http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html –
На этом сайте представлено более 100 вопросов по разбору HTML с регулярными выражениями, все из которых имеют один и тот же ответ: даже не утруждайте себя попытками; это не сработает, и независимо от того, насколько вы умны с вашими RE, это все равно не сработает. –
Элемент 'body' является строчным примером схемы XHTML: http://www.w3.org/TR/xhtml1-schema/ XHTML является XML; если он не прошел проверку, это неакционер. – McDowell