Мне нужно запустить логистическую регрессию на огромном наборе данных (много ГБ данных). В настоящее время я использую пакет GLM Julia для этого. Хотя моя регрессия работает с подмножествами данных, у меня заканчивается память, когда я пытаюсь запустить ее на полном наборе данных.Логистическая регрессия на огромном наборе данных
Есть ли способ вычислить логистические регрессии на огромных, не разреженных наборах данных без использования запретного объема памяти? Я думал о разделении данных на куски, вычислении регрессий по каждому из них и их агрегации как-то, но я не уверен, что это даст правильные результаты.