2013-03-18 2 views
-2

Я знаю, что я не должен использовать регулярное выражение в HTML. Я хотел бы извлечь источники изображения из HTML-файла, пример ниже:Regex - Извлечение img src из HTML

Это может выглядеть следующим образом:

<img src = cid:header width="700" height="93" alt="Logo" /> 
<img src= cid:header width="700" height="93" alt="Logo" /> 
<img src =cid:header width="700" height="93" alt="Logo" /> 
<img src=cid:header width="700" height="93" alt="Logo" /> 

В каждом случае I'ld хотел бы получить «ИДС заголовок», как результат.

Поскольку мое знание регулярных выражений в основном равно нулю, я обращаюсь к вам, ребята. Мне нужен шаблон, который принимает пробел после «src» или после символа «=».

ЦСИ [mightBeSpace] = [mightBeSpace] чид: [mustNotBeSpace]

Спасибо!

ответ

2
^<img src\s?=\s?([^\s]+).*/>$ 
+1

Я представил это как есть, чтобы соответствовать одной строке txt, которая содержит только то, что вы предоставили. Помните (как отметил @Kolink), что RegEx ужасен при сопоставлении HTML – rbedger

+0

src \ s? = \ S? ([^ \ S] +) это единственная партия, в которой я нуждался, спасибо! –

+0

, пожалуйста, отметьте как ответ, если вы считаете, что он достаточно ответил на ваш вопрос. – rbedger

2

«может быть пространство» в регулярном выражении является \s*, и «не должно быть пространство» переводится \S+

Используя эту информацию, вы должны быть в состоянии построить регулярное выражение. Если вы не можете, пожалуйста, покажите, что вы пробовали.

+0

src \ s? = \ S? ([^ \ S] +) решил, спасибо за вашу помощь! –

Смежные вопросы