Я пытаюсь разобрать действительно большой файл JSON в Python. Файл имеет 6523440 строк, но разбит на множество объектов JSON.Разбор большого файла JSON в Python
структура выглядит следующим образом:
[
{
"projects": [
...
]
}
]
[
{
"projects": [
...
]
}
]
....
....
....
и он идет дальше и дальше ...
Каждый раз, когда я пытаюсь загрузить его с помощью json.load() я получаю сообщение об ошибке
ValueError: Extra data: line 2247 column 1 - line 6523440 column 1 (char 101207 - 295464118)
На линии, где заканчивается первый объект, и начинается второй. Есть ли способ загрузить их отдельно или что-то подобное?
Я думаю, что вы должны разобрать файл самостоятельно и разделить его на отдельные объекты * до * передавая его 'json.load' - он не обрабатывает чтение немного, и передавая ее обратно, как, например, 'pickle', AFAIK. – jonrsharpe
Эта структура предлагает несколько массивов одного объекта – danielcooperxyz
Это так. 2900 из них, если быть точным – Luka