Я распределил информацию по нескольким большим CSV-файлам. Я хочу, чтобы объединить все файлы в один новый файл, например в первом ряду от первого файла в сочетании с первой строки из другого файла и т.д.Python объединяет строки из разных файлов в один файл данных
file1.csv
A,B
A,C
A,D
file2.csv
F,G
H,I
J,K
ожидаемый результат:
output.csv
A,B,F,G
A,C,H,I
A,D,J,K
поэтому рассмотрим, что у меня есть массив ['file1.csv', 'file2.csv', ...]
Как это сделать?
Я попытался загрузить каждый файл в память и объединить на np.column_stack
, но мои файлы слишком велики, чтобы вписаться в память.
Я не буду писать ваш код для вас, но я предлагаю повторять его по строкам и использовать 'str.join (',', (file1line, file2line))' для создания вашей выходной строки. Возможно, вам также придется отключить новые строки из строк ввода. – SiHa
@SiHa. Спасибо за ваш комментарий. Однако моя проблема в том, что у меня есть 50 файлов. как я могу перебирать все файлы параллельно? – belas
50 файлов несколько сложнее :) См. Ответ ниже. – SiHa