Мне нужно извлечь все ссылки на изображения в документе HTML. На самом деле я могу извлечь значение HREF атрибута с помощью этого RegExp:Регулярное выражение, чтобы найти атрибут href для HTML с расширением изображения
private static final String HTML_A_HREF_TAG_PATTERN =
"\\s*(?i)href\\s*=\\s*(\"([^\"]*\")|'[^']*'|([^'\">\\s]+))";
Мне нужно получить только ссылку на изображение, так что я должен проверить, если строка матч с расширением изображений (JPG, JPEG, PNG, GIF).
Как изменить шаблон?
Неужели вы что-то пробовали? –
Попробуйте это (в синтаксисе perl): 'href \ s * = \ s * ['"] ([^' "] +. (?: jpg | png | jpeg | gif)) ['"] ' – fronthem
Пробуйте попытку это: http://codereview.stackexchange.com/questions/20126/regex-to-get-all-image-links –