Я храню RDD, используя storageLevel = MEMORY_ONLY_SER_2, в случае потери одного исполнителя, есть еще одна копия данных.Spark: MEMORY_ONLY_SER_2 - странное поведение памяти
Тогда я нашел что-то странное:
- Размер памяти из 2xReplicated РДУ, кажется, то же самое сравнение, когда я использовал storageLevel = MEMORY_ONLY_SER (1xReplicated)
- Фракция Cached не смог достичь 100%, хотя у меня все еще осталось много памяти.
Я правильно понимаю памятьLevel = MEMORY_ONLY_SER_2? почему 2xReplicated не имеет в два раза Размер в памяти по сравнению с 1xReplicated? Благодаря!