Из этого question и других кажется, что не рекомендуется использовать concat
или append
, чтобы построить базу данных pandas, потому что он каждый раз обрабатывает всю фреймворк данных.Python - эффективный способ добавления строк в dataframe
Мой проект предусматривает получение небольшого количества данных каждые 30 секунд. Это может зайти на 3-х дневный уик-энд, поэтому кто-то может легко ожидать более 8000 строк, которые будут созданы по одной строке за раз. Каким будет наиболее эффективный способ добавления строк в этот фреймворк?
Если вы добавляете только строку каждые 30 секунд, действительно ли она должна быть эффективной? –
Есть ли причина, по которой он должен быть DataFrame? Почему бы просто не записать его в файл, а затем конвертировать в конец? – sundance
@ Stephen Rauch Ну, я надеялся сохранить свои образцы как можно ближе к каждые 30 секунд. Возможно, неправильно, я вытаскиваю данные, а затем добавляю их в dataframe, затем используя 'time.sleep (30)' до своего времени, чтобы получить следующий набор данных. Мое беспокойство заключалось в том, что он становится больше, чем время загрузки начнет увеличивать время между каждым образцом. Из этого вопроса [link] (http://stackoverflow.com/questions/10715965/add-one-row-in-a-pandas-dataframe) кажется, что при размере 6000 требуется 2,29 секунды. Я хотел бы, если возможно, свести это число к минимуму. – Jarrod