У меня есть CSV-подобный текстовый файл, который имеет около 1000 строк. Между каждой записью в файле находится длинная серия тире. Записи обычно заканчиваются символом \ n, но иногда перед \ n до конца записи появляется дополнительный \ n. Упрощенный пример:Отрицательный взгляд после новой строки?
"1x", "1y", "Hi there"
-------------------------------
"2x", "2y", "Hello - I'm lost"
-------------------------------
"3x", "3y", "How ya
doing?"
-------------------------------
Я хочу, чтобы заменить дополнительный \ п с пробелами, т.е. конкатенации строк между штрихами. Я думал, что я мог бы сделать это (Python 2.5):
text = open("thefile.txt", "r").read()
better_text = re.sub(r'\n(?!\-)', ' ', text)
, но это, кажется, заменить все \ п, а не только те, которые не следует тир. Что я делаю не так?
Я задаю этот вопрос, пытаясь улучшить свои собственные навыки регулярного выражения и понять ошибки, которые я совершил. Конечная цель состоит в том, чтобы сгенерировать текстовый файл в формате, который можно использовать с помощью специального макроса VBA для Word, который генерирует документ Word в стиле, который затем будет перевариваться с помощью Word-friendly CMS.
Если бы это был Perl, я бы сказал, что set '$ /' to ''------------------------------- ' –