У меня есть словарь ввода, который выглядит следующим образом:Python-словарь синтаксический и обновить лучше
{"payment":
{"payment_id": "AAHPW34190", "clm_list":
{"dtl":
[{"clm_id": "1A2345"},
{"clm_id": "9999"}
]},
"payment_amt": "20"}}
Мне нужен выход, чтобы выглядеть следующим образом:
{ "create":
{ "_index": "website", "_type": "blog", "_id": "AAHPW34190"}}
{"payment_id": "AAHPW34190", "clm_list":
{"dtl":
[{"clm_id": "1A2345"},
{"clm_id": "9999"}
]},
"payment_amt": "20"}
Значение _id в первом строка вывода выводится из payment_id. я могу получить выше вывод легко, выполнив следующие действия:
static_line={ "create": { "_index": "website", "_type": "blog", "_id": "0"}}
orig={"payment": {"payment_id": "AAHPW34190", "clm_list": {"dtl": [{"clm_id": "1A2345"}, {"clm_id": "9999"}]}, "payment_amt": "20"}}`
sec_line=orig["payment"]
static_line["_id"]=sec_line["payment_id"]`
Но мой вклад будет миллион Dict элементов, и я хочу сделать это как можно более эффективно. Так могу ли я сделать это лучше для миллиона диктов?
вы читаете эти данные из файла или это уже в памяти? –
В prod я буду читать его из файла, а вывод будет в файле. Я планирую использовать GNU параллельно, чтобы плюнуть на входной файл и передать его всем ядрам сервера, тем самым распараллеливая процесс – user3646519