2012-04-10 7 views
0

в моем проекте Я хочу получить теги с веб-страницы для этого, я использовал методы dom.Регулярное выражение для извлечения тегов

Но метки могут создаваться динамически, как document.write(“<a href=”http://somedomain.com”>”);

здесь теги приведены в формате строки, так что я пытаюсь использовать регулярные выражения.

Я хочу, чтобы регулярное выражение, которое соответствует все теги и атрибуты при условии, что выражение должно быть в состоянии извлечь определенный атрибут также

ответ

0

Это очень трудно понять, что вы просите, и это очень неясно.

Прежде всего: никогда не используйте регулярное выражение для анализа HTML, если у вас есть опция. Это выглядит просто так? Нет. Вы рано или поздно найдете проблему.

Второй: what David said.

Теперь вот регулярное выражение, чтобы соответствовать любой HTML-тег (не проверял, или что-нибудь так, попробовать его первым, если необходимо):

\<[^>]*\> 

Имейте в виду, что будет соответствовать тег сценария тоже (не позволяй пользователи пишут какие-либо теги на свою страницу, добавьте в белый список несколько, если нужно, и будьте готовы к проблемам, если не используете библиотеку).

Попробуйте это на RegExr, например (но напомним, что он использует регулярные выражения ActionScript, могут отличаться от тех, Javascript иногда, например, Javascript не имеет опережения/просмотра назад.

Смежные вопросы