2016-12-08 3 views
1

Ищем после подхода для следующей задачи:Reconstruct управление версиями из набора файлов

данного набора файлов, которые очень похожи (я использую Fuzzy хэширование здесь), я хотел бы, если знаю, это алгоритм, который позволяет маркировать эти файлы с номером версии. Результат должен возвращать последовательный порядок, когда эти файлы были сгенерированы.

Причина в том, что мне нужно реорганизовать данные команды, не знакомой с контролем версий.

Спасибо

ответ

0

довольно простой подход (я надеюсь) будет пытаться преобразовать это в какой-то проблемы графа.

Предположим, что каждый файл представляет собой узел с ребрами между двумя файлами.
Вес края между двумя узлами будет, например, количеством различных строк между файлами (или некоторой другой функцией).

Что вы делаете дальше, это поиск нециклического пути, который проходит все файлы с минимальной стоимостью. что-то вроде this, если вы знаете первый файл и последний.
Вы можете добавить пустой файл и самую последнюю версию у вас в качестве start и end узлов.

Я предполагаю, что это не даст вам точный результат, но, вероятно, даст вам хорошую отправную точку.
Надеюсь, это полезно.

+0

спасибо. звучит интересно ! –

Смежные вопросы