Я хотел бы запустить корреляцию Spearman на данных, которые в настоящее время находятся в Spark DataFrame. В настоящее время доступен только расчет корреляции Пирсона для работы с столбцами в DataFrame. Похоже, что я могу сделать корреляцию Спирмена с помощью MLLib Spark, но мне нужно передать два RDD [Double] в функцию. Столбцы, которые я хочу сравнить, являются Double в соответствии с текущей схемой.Вычислить корреляцию Spearman на Spark DataFrame
Есть ли способ выбрать столбцы, которые я хочу, и сделать массив парными, чтобы я мог использовать корреляционную функцию MLlib для получения коэффициента корреляции Спирмена?