2010-09-08 2 views
0

Можно создать дубликат:
RegEx match open tags except XHTML self-contained tagsRegex Синтаксический HTML

Я хотел бы, чтобы гарантировать, что HTML атрибуты имеют кавычки вокруг них, как требуется XHTML.

Например:

<BODY link=#0000ff vLink=#800080> 

должен быть

<BODY link="#0000ff" vLink="#800080"> 

Ищу шаблон Regex, что бы справиться с этим.

Благодаря

+0

Parsing Html Cthulhu Way, http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html –

+2

На этом сайте представлено более 100 вопросов по разбору HTML с регулярными выражениями, все из которых имеют один и тот же ответ: даже не утруждайте себя попытками; это не сработает, и независимо от того, насколько вы умны с вашими RE, это все равно не сработает. –

+0

Элемент 'body' является строчным примером схемы XHTML: http://www.w3.org/TR/xhtml1-schema/ XHTML является XML; если он не прошел проверку, это неакционер. – McDowell

ответ

2

Хотя не точная копия, основной ответ тот же.

Что вы хотите, это не регулярное выражение, а DOM-парсер.

Укажите, пожалуйста, язык вашей страны. Или вы намереваетесь сделать это с помощью JavaScript? Если это так, то не так много.

Предложение также, если вы делаете это, чтобы сделать его действительным XHTML, тогда вы, вероятно, знаете, что элемент body (и все элементы и атрибуты) используются в нижнем регистре.

Смежные вопросы