2013-12-03 6 views
0

Мне нужна помощь регулярного выражения.Регулярное выражение для поиска изображений

В принципе у меня есть это регулярное выражение:

src="([^"]+)" 

мне нужно улучшить его так, что он находит только те изображения, которые не имеют абсолютный путь к файлу, то есть: http://website.com/folder/image.jpg

мне это нужно так он отображает только изображения с помощью image.jpg и регулярное выражение, которое будет отображать список с абсолютным путем.

я бездельничал и пытался что-то вроде этого:

src=.*http\:.+"([^"]+)" 

, но он не работает ...

+1

вы можете использовать запрос выбора XPath/css для захвата ссылки img – Michael

+0

В R убедитесь, что вы используете ', чтобы открывать/закрывать строки, содержащие ", если вы не используете символ \ escape. –

+0

src = ". * Http \: // ([^"] +) "- регулярное выражение работает, чтобы найти ссылки с изображениями, нужно только одно, которое найдет изображения без ссылок images.jpg, file1.jpg и т. Д. –

ответ

0

общее регулярное выражение, чтобы получить из них с только именами изображения могут быть

# \ssrc\s*=\s*"([^/"]+\.(?:jpg|gif|<whatever>))\s*" 

\s 
src 
\s* = \s* 
" 
(         # (1 start) 
     [^/"]+ 
     \. 
     (?: jpg | gif | <whatever>) 
)         # (1 end) 
\s* 
" 

Редактировать - без расширения конкретного файла

# \ssrc\s*=\s*"([^/"]+\.[^/".]+" 

\s 
src 
\s* = \s* 
" 
(         # (1 start) 
     [^/"]+ 
     \. 
     [^/".]+ 
)         # (1 end) 
" 
+0

Работы, можно ли обойтись без указания расширения файла? –

+0

@dsme - Конечно, просто добавил. – sln

+0

Огромное спасибо! –

Смежные вопросы