У меня есть приложение Python, построенное с помощью Flask, которое позволяет импортировать множество записей данных (в любом месте от записей 10k-250k + за один раз). Сейчас он вставляет в базу данных Cassandra, вставив одну запись, в то время как это:Как эффективно вставлять объемные данные в Cassandra с помощью Python?
for transaction in transactions:
self.transaction_table.insert_record(transaction)
Этот процесс невероятно медленно. Существует ли наилучший подход, который я мог бы использовать для более эффективного ввода этих объемных данных?
Очевидным было бы попробовать объемные вставки запросов, которые Cassandra поддерживает. Кроме того, подготовка запроса и повторное использование его может быть быстрее, чем объемные вставки. Но не ожидайте, что импорт 250 тыс. Записей будет быстрым. Может быть, вам следует делегировать работу работнику (работникам)? – freakish