2014-10-30 5 views
0

Я пытаюсь загрузить все изображения, которые появляются на странице с помощью WGET, кажется, что eveything отлично, но на самом деле команда загружает только первые 6 изображений, и не более того. Я не могу понять, почему.скачать все изображения на странице с WGET

Команды я использовал:

wget -nd -r -P . -A jpeg,jpg http://www.edpeers.com/2013/weddings/umbria-wedding-photographer/ 

Это загружая только первые 6 изображений соответствующих страниц и все других вещей, которые я не нужен, смотрите на странице, любая идея, почему это только получение первые 6 релевантных изображений?

Заранее спасибо.

+0

Я пробовал вашу команду, и она начала загружать все изображения. У вас все еще есть эта проблема? возможно, сервер был медленным – rubo77

+0

Если вы заметили, файлы изображений, перечисленные на странице, начинаются с aa_umbria *, моя команда вместо этого после загрузки первых 6 изображений, начиная с этого, загружает все остальные изображения, не связанные с текущей страницей. – pwnjack

+0

Использование '-r' неверно, это будет 5 уровней рекурсии. То, что вы хотите, это '-p' (small p): http://explainshell.com/explain?cmd=wget+-nd+-r+-P+.+-A+jpeg%2Cjpg+http%3A%2F%2Fwww. edpeers.com% 2F – rubo77

ответ

0

Я думаю, что главная проблема в том, что есть только 6 JPEGs на этом сайте, все остальные GIFs, пример:

<img src="http://www.edpeers.com/wp-content/themes/prophoto5/images/blank.gif" 
data-lazyload-src="http://www.edpeers.com/wp-content/uploads/2013/11/aa_umbria-italy-wedding_075.jpg" 
class="alignnone size-full wp-image-12934 aligncenter" width="666" height="444" 
alt="Umbria wedding photographer" title="Umbria wedding photographer"/

данных LazyLoad-Src является JQuery плагин, который бы не скачать в формате JPEG, см http://www.appelsiini.net/projects/lazyload

Попробуйте -p вместо -r

wget -nd -p -P . -A jpeg,jpg http://www.edpeers.com/2013/weddings/umbria-wedding-photographer/ 

см http://explainshell.com:

-p 
--page-requisites 
    This option causes Wget to download all the files that are necessary to properly display a given HTML 
    page. This includes such things as inlined images, sounds, and referenced stylesheets. 
+1

Я пробовал вашу команду, но она загружает только 3 изображения, я думаю, что из-за этого плагина lazyload, который изменяет атрибут src на data-src, и wget не распознает, что загрузить, не так ли? – pwnjack

+0

приведенный выше комментарий, скорее всего, правильный ответ – Paracetamol

+0

Если вы хотите скачать все изображения data-lazyload-src, вам понадобится разбор страницы с 'sed s/data-lazyload-src/src/g' – rubo77

Смежные вопросы