2013-03-04 8 views
0

У меня есть файл, который мне нужно получить, тогда мне нужно пройти через этот файл и загрузить все перечисленные изображения. Формат - xml, но я не хочу использовать XML-парсер.wget для загрузки изображений из полученного файла

Когда я использую

 
sudo wget --restrict-file-names=windows -nH -nd -r -i -P images \ -A jpeg,jpg,gif,png https://url.com/api/ojgnvhy75hGvcf36dnJO0947bsh62gbs?_=1361842359357 

Я получаю файл XML загружен, но мне нужны образы, которые есть ссылки в этом файле.

Что я здесь делаю неправильно?

ответ

0

Я получил следующий код, получив XML-файл и сохранил его в тексте, затем я получаю ссылки из текстового файла, используя sed, и записываю их в другой файл, затем используйте wget в этом файле для загрузки изображений ,

 
#!/bin/dash 

wget -O xml.txt 'https://url_to_download_from' 
links=$(sed -n "/image>/s/^ .\([^>]*\)<\/image>.*/\1/gpw links.txt" xml.txt) 
wget -N -P images -A png -i $links 

К сожалению, это приводит к появлению множества файлов, которые не являются изображениями, хотя я запрашиваю только изображения.

После завершения этого сценария я запустил следующие команды для очистки папки.

 
cd images 
shopt -s extglob nocaseglob 
rm !(*.png) 
Смежные вопросы