У меня есть текстовый файл объемом 25 ГБ. поэтому я сжал его до tar.gz, и он стал 450 МБ. теперь я хочу прочитать этот файл с python и обработать текстовые данные. Для этого я назвал question. но в моем случае код не работает. код выглядит следующим образом:Прочтите файл .tar.gz в Python
import tarfile
import numpy as np
tar = tarfile.open("filename.tar.gz", "r:gz")
for member in tar.getmembers():
f=tar.extractfile(member)
content = f.read()
Data = np.loadtxt(content)
ошибка выглядит следующим образом:
Traceback (most recent call last):
File "dataExtPlot.py", line 21, in <module>
content = f.read()
AttributeError: 'NoneType' object has no attribute 'read'
также, Есть ли другой способ, чтобы выполнить эту задачу?
Что-то вроде http://stackoverflow.com/q/33113600/ 1240268 –
* Если элемент не указан выше, возвращается None. *, Член не является файлом или ссылкой. –