У меня есть несколько текстовых файлов с ОДИНОЧНЫМИ КОЛОННАМИ внутри каталога. Мне нужно объединить все их в один текстовый файл, удалив повторяющиеся строки. Я делаю со следующим кодом. Однако мои текстовые файлы чрезвычайно велики. Итак, каков наилучший и быстрый способ сделать это?Самый быстрый способ объединить несколько текстовых файлов без повторяющихся строк
import os, glob
files = glob.glob('*.txt')
with open('combinedfile.txt','w') as fo:
all_lines = []
for f in files:
with open(f,'r') as fi:
all_lines.append(fi.read())
all_lines = set(all_lines)
for item in all_lines:
fo.write(item + '\n')
Я использую Python 2.7 – Borys