2015-03-14 2 views
0

Я пытаюсь загрузить все файлы в онлайн-каталог. Команда, я использую это:с помощью wget для загрузки каталога

wget -r -np -nH -R index.html http://www.oecd-nea.org/dbforms/data/eva/evatapes/mendl_2/

С помощью этой команды я получаю пустой каталог. Если я укажу имена файлов в конце, я могу получить их по одному, но я хотел бы получить их все сразу. Я просто пропустил что-то простое?

вывода команды:

--2015-03-14 14: 54: 05-- http://www.oecd-nea.org/dbforms/data/evaevatapes/mendl_2/ Разрешающая www.oecd-nea.org ... 193.51.64.80 Подключение к www.oecd-неа .org | 193.51.64.80 |: 80 ... подключен. HTTP-запрос отправлен, ожидающий ответа ... 200 OK Длина: не указано [текст/html] Сохранение: âdbforms/data/eva/evatapes/mendl_2/index.htmlâdbforms/data/eva/evatapes/mendl_2/index.htmlавтороб .txtârobots.txt

+0

Это, кажется, не будет программирование вопроса ко мне. – sje397

+0

Я бы сказал, что это - программная загрузка файлов. –

+0

. Есть ли лучший форум для публикации этого вопроса? – Arland

ответ

1

Добавьте глубину ссылок, которые вы хотите следовать (-l1, так как вы только хотите, чтобы следовать одной ссылке):

wget -e robots=off -l1 -r -np -nH -R index.html http://www.oecd-nea.org/dbforms/data/eva/evatapes/mendl_2/ 

Я также добавил -e robots=off, так как существует robots.txt, который обычно остановить wget от прохождения через этот каталог. Для остального мира:

  • -r рекурсивного,
  • -np нет родительского каталога
  • -nH не охватывающего через хосты
+0

Я снова попробовал, пустой каталог – Arland

+0

@Marcus Müller Вы забыли index.html после -R – Niols

+0

А! Кажется, что robot.txt не позволяет вам загружать это. Поэтому я добавил '-e robots = off', @Arland. –

Смежные вопросы