Я пытаюсь создать файл оболочки, который будет захватывать все изображения из топлиста wallbase.cc
. Пока у меня это так, что он заворачивает html-код (using mac so no wget
) и захватывает все ссылки на изображения. Единственная проблема, с которой я сталкиваюсь, заключается в том, что когда я grep для ссылок, он возвращает <a href=link> <target=blank>
. То, что я пытаюсь сделать, это извлечь ссылку, чтобы я мог ее закрутить в файл. Я думал об использовании внешнего Java или C-файла для извлечения ссылок, но я полагаю, что есть чистый способ bash сделать это.Как извлечь ссылку из html-файла с помощью bash
Любая помощь будет отличной.
редактировать: мои команды до сих пор
Grep <a href="http://wallbase.cc/wallpaper/' wallbase.source
Это возвращает все ссылки, включая HTML код. мне просто нужно трубы это с некоторой команды для того, чтобы лишить HTML и оставить ссылки
Добро пожаловать на переполнение стека! Могли бы вы опубликовать команды, которые вы пробовали до сих пор? – joews
Ive пробовал использовать sed и awk и даже шаблоны регулярных выражений, но без успеха – QuinnFTW
Люди смогут помочь вам лучше, если вы опубликуете фактические конкретные команды, которые вы пробовали. – joews