Мне интересно, если следующий простой код будет работать в распределенной среде (он действительно работает в автономном режиме)?Apache Spark: обновить глобальные переменные в рабочих
public class TestClass {
private static double[][] testArray = new double[4][];
public static void main(String[] args) {
for(int i = 0; i<4; i++)
{
testArray[i] = new double[10];
}
...
JavaRDD<String> testRDD = sc.textFile("testfile", 4).mapPartitionsWithIndex(
new Function2<Integer, Iterator<String>, Iterator<String> >() {
@Override
public Iterator<String> call(Integer ind, Iterator<String> s) {
/*Update testArray[ind]*/
}
}, true
);
...
Если предполагается работать, интересно, как искра посылает часть testArray от рабочего до главного узла?
на голосование закрыть: это совершенно правильный вопрос и ценный для других. Не видишь причину закрытия. Оставьте комментарий с рекомендациями по улучшению. – maasg