У меня есть папка с несколькими текстовыми файлами в том, что мне нужно обрабатывать и формат, используя несколько списков запасных выглядящие как это:несколько регулярных выражений замены на основе списков в нескольких файлах
old string1~new string1
old string2~new string2
etc~blah
Я бегу каждую замену пары от замены списки в каждой строке этих текстовых файлов. Теперь у меня есть набор скриптов python для выполнения этой операции. Что мне интересно, будет ли он сделать код более простым и удобным, если я переключусь на sed или awk? Будет ли это лучшим решением или мне лучше улучшить код Python? Я прошу, потому что входящие текстовые файлы поступают регулярно и часто имеют немного другую структуру, чем раньше, например, ошибки, орфографические ошибки, несколько пробелов, поскольку эти файлы создаются людьми. Поэтому я должен постоянно настраивать списки кода и замены, чтобы он работал правильно. Спасибо.
Трудно сказать, не видя ваш код на Python, поэтому у нас есть лучшая идея, если там есть бутылочная горка ... –
Вы использовали слово «строка» в своем вопросе, но принятое вами решение использует вместо этого регулярные выражения, так что это на левая сторона «~» сверху - строки или регулярные выражения? –
Да, я сожалею о путанице, я использую регулярные выражения, а те строки с ~ на самом деле являются регулярными выражениями. –