Кто-то подарил мне очень большой список копий, чтобы сделать длинный HTML-документ. Правки в формате:Соответствующие фрагменты в HTML-документе
«религиозный» должен быть «религия»
«их» должна быть «там»
«вы должны настойчивым» должны быть «вы должны быть стойким»
Скопированные были напечатаны вручную; в некоторых случаях «фактическое» значение слева не является точным соответствием для содержимого в документе. Порядок изменений обычно правильный, но даже это не гарантируется.
Это простая, но очень большая задача применить эти изменения вручную к документу. Я хотел бы автоматизировать процесс как можно больше, например. путем автоматического поиска фрагментов.
В длинном документе, подобном этому, я не могу просто искать все экземпляры «их» и заменить их «там». Иногда «их» использовались правильно, просто не в одном конкретном случае.
Другими словами, я ищу нечеткое текстовое совпадение, в котором порядок изменений влияет на поиск.
Что такое хороший подход к такой проблеме? Я надеюсь, что есть готовый проект с открытым исходным кодом, который может искать фрагменты в нечетком порядке.
Сколько может быть испортить заказ? – Jirka
@ Jirka-x1 Я не знаю, как ответить на этот вопрос формально. Предположим, что данное редактирование будет не более чем дюжиной мест не по порядку. (Надеюсь, это так.) Поэтому, если «их» -> «там» должно находиться в позиции 20, оно может находиться в положении 10 или позиции 30, но не в положении 1 или позиции 1000. –