Примечание. Это задание, а не прямой ответ, пожалуйста, укажите мне в правильном направлении.Зачистка всего содержимого за пределами <body> &</body> теги (и те теги сами)
Назначение - создать скрипт, который принимает путь в качестве аргумента. На этом пути он удалит все теги тела из каждого .html-файла в этом каталоге, а также теги тела и сохранит их в новом файле.
Моя проблема: я не могу на всю жизнь уйти от тегов тела. Смотрите мой бод ниже.
directory=$1
files=$(du -a $directory | find -name "*.html")
for f in $files; do
file=$f
outputdata=$(sed -n "/body/,/body/p" $file)
echo $outputdata
done
Любой совет?
... 'du -a'? Почему в ...? –
Является ли задание специально просить вас иметь дело с HTML из оболочки, или это просто плохо разработанное назначение, которое предполагает, что стандартные инструменты оболочки, такие как 'sed', подходят для обработки HTML? – chepner
Кроме того, это неправильный способ получить список имен файлов. См. Первую запись в http://mywiki.wooledge.org/BashPitfalls (ее заголовок говорит о 'ls', но в тексте также рассматривается« find »). –