У меня есть большой json-файл. Его данные журнала и я сжал его в формате bz2 (myfile.json.bz2). Размер файла bz2 составляет 90 МБ. Я искал, чтобы найти хорошее решение или сообщение в блоге, которое объясняет синтаксический анализ сжатого файла bz2 json эффективно, но не удалось найти.Python: Разбор большого json-файла
Поскольку файл большой, делать что-то подобное невозможно.
with open('data.json') as data_file:
data = json.load(data_file)
Какой лучший подход?
Через некоторое копаться я нашел там питон пакет читать BZ2
input_file = bz2.BZ2File(filename, 'r')
Вы хотите инкрементный json-парсер, например. см. этот ответ: [(link)] (http://stackoverflow.com/a/10715686/866915) Другая возможность такова: [(link)] (https://github.com/nigelsmall/jsonstream) – ErikR
с ' BZ2File' имеет метод 'read', который возвращает произвольное количество байтов, я бы, вероятно, подумал о том, чтобы попытаться прочитать json как поток, с чем-то вроде https://pypi.python.org/pypi/ijson/ – njzk2