У меня есть массив размеров 500 x 26. Используя операцию фильтра в pyspark, я бы хотел выделить столбцы, которые перечислены в другом массиве в строке i. Пример: если
a[i]= [1 2 3]
Pyspark: использование фильтра для выбора функции
Затем выберите столбцы 1, 2 и 3 и все строки. Можно ли это сделать с помощью команды фильтра? Если да, может ли кто-нибудь показать пример или синтаксис?
Если я уверен, что у вас есть rdd массивов (500x26), но как i s i подключен к элементам вашего rdd. – abalcerek
Это не связано .. просто элемент массива, который все – optimist