Я использую источники данных с плоскими файлами с инкрементной нагрузкой и вижу различную производительность в зависимости от того, как я загружаю. У меня есть 3 набора данных {d1, d2, d3}, где d1 и d2 имеют одинаковый размер, а d3 - в 3 раза больше. Я делаю следующий тест на компьютере с 16 Гб памяти:icCube incremental vs single load performance
- нагрузки d1 - время: 1m07s
- приращением нагрузки d2 - время: 2m53s
- пошагово загрузить d3 - выбегает из памяти
С другой стороны, если я выполняю одиночную нагрузку d1 + d2 + d3, общее время составляет 5m29s, и проблем с памятью не возникает.
Это просто вопрос памяти, когда вы делаете инкрементную или единую нагрузку или мне лучше управлять производительностью?