Мне нужно хранить массивы типов в RDD. Для этого я использую ArrayWritable класс от Hadoop :Эффективный способ хранения массива в RDD
static public class Record {
public long id;
public FloatArrayWritable dataArray;
}
Это работает, но я хотел бы быть уверенным, что объекты не будут упорядочены, если это не требуется. Я хотел бы сохранить в памяти как можно больше. Spark и Flink утверждают, что данные хранятся в памяти. В случае с классом ArrayWritable? Является ли это эффективным способом хранения массива? Спасибо!
Edit: из @mattinbits ответа, для Спарк, эффективный способ заключается в использовании Java массив или ArrayList (для динамического изменения размера)
Зачем использовать тип Hadoop, а не только обычный Java-массив? – mattinbits
Я начинаю с этой структурой. Как я понимаю, если я использую Java-массив, размер, если –
Незавершенный комментарий? – mattinbits