Я много искал, чтобы найти решение, но не смог его найти. Я знаю, как удалить все теги с помощью sed
, но мне нужно удалить только те теги HTML, которые пусты или имеют только табуляции или пробелы в них, а также явно удалять теги. Например:Удалить пустые теги HTML из файла с помощью sed
<p></p> or <p> </p>
Я использовал следующую команду, чтобы удалить все HTML-теги, он работает правильно, но я не хочу, чтобы удалить все теги.
sed -e 's/<[^>]*>//g' myfile.html
та же команда используется here. Пожалуйста, помогите мне.
Спасибо! еще одна проблема i, что тег не всегда закрывается как '>', некоторые теги написаны так: ''. будет ли эта команда сохранена для этих тегов? – Hammadzafar
, то используйте этот 'sed -r 's/<[^\/][^<>] *> * <\/?[^<>] * \ /?> // g' file' –
спасибо! он работает – Hammadzafar