В pandas documentation, говорится:Python Панды - Использование списка понимание для Concat кадров данных
Стоит отметить, однако, что CONCAT (и, следовательно, добавление) делает полную копию данных, и постоянное повторное использование этой функции может создать значительный удар по производительности. Если вам необходимо использовать операцию для нескольких наборов данных, используйте понимание списка.
frames = [ process_your_file(f) for f in files ]
result = pd.concat(frames)
Моя нынешняя ситуация такова, что я буду конкатенации новый dataframe к растущему списку кадров данных снова и снова. Это приведет к ужасающему числу конкатенаций.
Я беспокоюсь о производительности, и я не уверен, как использовать понимание списка в этом случае. Мой код выглядит следующим образом.
df = first_data_frame
while verify == True:
# download data (new data becomes available through each iteration)
# then turn [new] data into data frame, called 'temp'
frames = [df, temp]
df = concat(frames)
if condition_met:
verify == False
Я не думаю, что части, которые загружают данные и создают фрейм данных, актуальны; моя озабоченность связана с постоянной конкатенацией.
Как реализовать понимание списка в этом случае?