2014-11-25 3 views
3

Мое RDD может иметь столбцы с постоянным значением. Другими словами, дисперсия некоторых столбцов может быть равна нулю. Моя цель - удалить все такие столбцы из RDD (и в конечном счете вычислить матрицу ковариации для остальных столбцов). Как я могу это сделать?Удалить постоянные столбцы из RDD и вычислить матрицу ковариации

Спасибо и уважением,

+0

Комментарий удален. –

ответ

6

РДУ должен быть неизменен. Поэтому я не думаю, что вы хотите удалить что-то из этого, но просто map это что-то, что вам подходит и/или filter что-то (подробнее в documentation).

+0

Предположим, мне нужно удалить первые два столбца из RDD. Как мне это сделать? –

+1

Я думаю, вам нужно «сопоставить» его с помощью функции, которая отсекает первые два столбца от каждой записи. –

Смежные вопросы