Предыдущий комментарий, который я оставил, кажется, не были сохранены - так будет пытаться снова
Код для удаления (и) работал отлично благодаря
Вы правы - я смотрел сливаться 3 строки в одну строку, поэтому второй пример, который вы дали, где он выглядит, как чтение двух следующих строк в пространстве шаблонов, выглядит более перспективным. Однако выход не был тем, что я ожидал.
Теперь я понимаю, что код должен быть более сложным, и я больше не хочу беспокоить вас как мой ручной метод впрыскивания некоторого кода html в текстовый файл и его открытие в Openoffice и вставке в электронную таблицу требуется всего несколько секунд, и я чувствую, что вручную создавать кодировку sed для этого будет кошмаром.
По сути правила для преобразования HTML должно быть: [каждый тег был отформатирован, чтобы он отображался на своей собственной линии] я дал пример входного файла и желаемый выходной файл ниже для справки
1) если < тр> следует < тд> на следующей строке полностью удалить < тр> и < TD> линии [т.е. не выводить возврат каретки], а в строке NEXT придерживаться буквы «в начале этой строки» [не имеет значения, что возврат каретки в конце этой строки будет изменен позже]
2) если </TD> следует < тд> полностью удалить обе эти две строки [снова не выводить возврат каретки после этих линий] и на предыдущей строке вывода а», [не выводить возврат каретки] и NEXT line stick "в начале строки [не беспокойтесь о возврате конечной каретки позже будет изменен]
3) если </td> следует за </tr> удалите оба из этих строки и в предыдущей строке добавьте «в конец строки и окончательный c возврат брака.
Я дал пример того, что вход и желаемый результат будет:
ввод: http://medinfo.redirectme.net/input.txt
[разыскиваемый файл будет размещен в следующем сообщении - эта плата не позволит новым пользователям опубликуйте сообщение с более чем одной гиперссылкой!]
есть дополнительная проблема, что столбец адресов находится на нескольких строках входного файла - это можно свести к одной строке, посмотрев, был ли первый символ NEXT строка - это «Если это не так, не выводите возврат каретки в конце текущего li пе
Уф, который был кошмар просто впечатать никогда не возражаю на самом деле код. Но еще раз спасибо за вашу помощь в получении этого! :-)
DOS? Ты злишься? (Есть sed для DOS?) –
да: http://gnuwin32.sourceforge.net/packages/sed.htm sed позволил мне вытащить фрагменты текста из файла HTML, а затем сбросить в новый файл – Rhys
I подозревают, что это не DOS, но это оболочка CMD в Windows. –