У меня есть файл json data_large размером 150.1MB. Содержимое внутри файла имеет тип [{"score": 68},{"score": 78}]
. Мне нужно найти список уникальных баллов по каждому предмету.Python - найти уникальные значения из большого json-файла эффективно
Это то, что я делаю: -
import ijson # since json file is large, hence making use of ijson
f = open ('data_large')
content = ijson.items(f, 'item') # json loads quickly here as compared to when json.load(f) is used.
print set(i['score'] for i in content) #this line is actually taking a long time to get processed.
Могу ли я сделать print set(i['score'] for i in content)
линию более эффективной. В настоящее время он принимает 201secs для выполнения. Может ли он быть более эффективным?
Смотрите также: [Этот вопрос на CodeReview.SE] (http://codereview.stackexchange.com/questions/38574/how-to-find-the-unique-values-from-the-json-file). – poke