У меня есть file1 имеет информацию об области, как 1-я хромосома человека из положения 1 в положение 10, выглядит следующим образом: chromosome,start_position,end_position 1,1,10 1,11,20
Как добавить все значения ключей и распечатать новый словарь?
file2 имеет значения для каждой позиции, как позиции 6 на 1-я хромосома человека с некоторого значения, выглядит следующим образом: chromosome,position,value 1,1,value1 1,2,value2 1,6,value3 1,13,value4
Я хочу добавить значения в file2 к file1, основываясь на позиции в file2, принадлежит ли к какой-либо области в file1, что-то вроде: chromosome,start_position,end_position,total_value 1,1,10,value1+value2+value3 1,11,20,value4
Оба файла могут быть более 10 м ллиллин строк. Должен ли я сделать это, просматривая каждую строку файла2 (чтобы увидеть, находится ли позиция в любом регионе файла1) или сделать каждую строку файла1 в словаре (затем найти значение в файле2? затем добавьте?)?
И как я могу получить «общее значение» каждой строки в файле1? Спасибо всем!
Добро пожаловать в переполнение стека! Сначала вы можете взять тур (http://stackoverflow.com/tour) и узнать [Как задать хороший вопрос] (http://stackoverflow.com/help/how-to-ask) и создать [ Minimal, Complete и Verifiable] (http://stackoverflow.com/help/mcve). Это облегчает нам помощь. –
Этот вопрос не дает понять, как вам нужно комбинировать 'file1' и' file2' –
Мне нравится подход к словарю. Он будет потреблять несколько концертов, но если ваша машина наполовину приличная, это не так уж и важно. Вы сохраните память, если вы можете сохранить ключ как строку, например «1,1,10», вместо того, чтобы разбить ее на кортеж. – tdelaney