Я делаю некоторые упражнения с наборами данных, как так:Список со многими словарями VS с несколькими списками?
Список со многими словарями
users = [
{"id": 0, "name": "Ashley"},
{"id": 1, "name": "Ben"},
{"id": 2, "name": "Conrad"},
{"id": 3, "name": "Doug"},
{"id": 4, "name": "Evin"},
{"id": 5, "name": "Florian"},
{"id": 6, "name": "Gerald"}
]
словарь с несколькими списками
users2 = {
"id": [0, 1, 2, 3, 4, 5, 6],
"name": ["Ashley", "Ben", "Conrad", "Doug","Evin", "Florian", "Gerald"]
}
Панды dataframes
import pandas as pd
pd_users = pd.DataFrame(users)
pd_users2 = pd.DataFrame(users2)
print pd_users == pd_users2
Вопросы:
- Должен ли я структурировать наборы данных, как пользователи или как потребляющие2?
- Существуют ли отличия в производительности?
- Является ли еще более удобочитаемым, чем другим?
- Есть ли стандарт, которому я должен следовать?
- Обычно я конвертирую их в dataframes pandas. Когда я это делаю, обе версии идентичны ... правильно?
- Выходные данные верны для каждого элемента, поэтому не имеет значения, правильно ли я работаю с panda df?
Хорошие вопросы Я пойду с первым вариантом, потому что я Recon поиск и вставка будет менее утомительным по сравнению с второй – therealprashant
Я бы пошел с первым, пока удобство использования является самым важным аспектом. Наличие идентификатора вместе с NAME будет удобно при перемещении. –
Первая версия легко сортируется, а вторая - нет. –