wget --page-реквизиты локально?

У меня есть локальный файл HTML, ссылающийся на данные изображения и стиля в разных местах локальной файловой системы. Я хотел бы получить список всех файлов с ссылками; или, альтернативно, команду, которая скопирует файлы HTML и все указанные файлы в какое-либо ясное место (с или без изменения ссылок в файле HTML), чтобы я мог создать автономный ZIP-файл на странице HTML.wget --page-реквизиты локально?

Похоже, что wget обеспечивает хорошую поддержку для загрузки HTML-файла, включая все предварительные требования (изображения, стили), используя флаг --page-requisites. К сожалению, он не поддерживает URL-адрес file://.

Какие у меня варианты?

источник

2013-08-19 Joachim Breitner

Wget не поддерживает протоколы HTTP, HTTPS и FTP. Итак, у вас есть 3 варианта: 1.Чтобы разоблачить свои файлы с помощью FTP, загрузите все. 2. Чтобы изменить источник wget и выполнить обновление. 3. Измените инструмент, который вы используете, попробуйте http://www.httrack.com/, поможет ли он вам idk? :) – user1759572

Использование другого инструмента в порядке, если это бесплатный инструмент командной строки для Linux, желательно упакованный в Debian. –

httrack может работать, хотя, похоже, он настаивает на том, чтобы поместить полный путь к исходному файлу в пути назначения. Альтернативой будет «wget» с временным веб-сервером, например «python -m SimpleHTTPServer», но это шаткое из-за угадывания свободного порта и последующего убийства веб-сервера. –

Почему бы не настроить локальный сервер Apache и не обслуживать его с локального хоста?

Вы можете использовать EasyPHP, MAMP или другое, чтобы легко настроить локальный сервер Apache.

источник

2013-10-17 14:10:50 mcdado

Это было бы полным излишеством для моего использования. На данный момент я прибегал к скрипту xslt, который извлекает включенные изображения, но, конечно, он не является полным (например, стили, изображения, упомянутые в стилях). –

wget --page-реквизиты локально?

ответ

Смежные вопросы