С проблемой несколько лет сталкивается с проблемой python. Я биоинформатика без базовых навыков программирования, и я работаю с огромными текстовыми файлами (около 25 гб), которые мне приходится обрабатывать.Чтение строк из ОГРОМНЫХ текстовых файлов по группам из 4
Я должен прочитать файл txt по строкам по группам из 4 строк за раз, что означает, что первые 4 строки должны быть прочитаны и обработаны, а затем я должен прочитать вторую группу из 4 строк и скоро.
Очевидно, я не могу использовать оператор readlines(), потому что он перегрузит мою память, и я должен использовать каждую из 4 строк для некоторого распознавания строк.
Я думал об использовании для цикла с диапазоне оператора:
openfile = open(path, 'r')
for elem in range(0, len(openfile), 4):
line1 = readline()
line2 = readline()
line3 = readline()
line4 = readline()
(process lines...)
К сожалению, это не possibile, так как файл в "чтении" режиме не может быть повторен и обработан как список или словарь.
Может ли кто-нибудь помочь в правильном цикле?
Заранее спасибо
В файлах Python открыт для чтения может быть легко итерации в линейно-ориентированной манере - см раздел на 'file.next()' здесь: http://docs.python.org/library/stdtypes.html?highlight=file.next#file.next – martineau