У меня есть два файла, оба очень большие. Файлы перепутали информацию между собой, и мне нужно сравнить два файла и подключить линии, которые пересекаются.Подключение похожих строк из двух наполнителей
Примером может быть:
первый файл имеет
var1:var2:var3
2-й будет иметь
var2:var3:var4
Мне нужно соединить их в третий файл с выходом: var1:var2:var3:var4
. Обратите внимание, что строки не совпадают, var4, которые должны идти с var1 (поскольку они имеют var2
и var3
вместе). Var2 и Var3 являются общими для Var1 и Var4. может быть далеко в этих огромных файлах. Мне нужно найти способ сравнить каждую строку и подключить ее к одному во втором файле. Кажется, я ничего не думаю о адекватной петле. Есть идеи?
Как вы различать, когда две строки Имеете две или более записей («var _ _» в вашем примере)? По крайней мере один общий? –
mojo
Третий создаваемый файл должен быть в таком формате: var1: var2: var3: var4. Var2 и var3 являются общими для var1 и var3. Var2 и Var3 всегда объединяются в пары, поэтому, если один из них распространен, то другой. – user3184354
Гарантировано ли, что 'var2' происходит только один раз в каждом файле? Является ли «пересечение» гарантией существования только один раз между двумя файлами? I.e., учитывая строку из файла1, существуют ли более чем одна строка, содержащая записи (например, 'var2' или' var4'), которые она содержит? – mojo