2
Я новичок в spark.I загрузил файл csv с sc.textFile
. Я хочу использовать reduceByKey для суммирования столбца, который находится в строковом типе, но содержит числа. Когда я пытаюсь что-то вроде этого reduceByKey(_ + _)
, он просто помещает числа рядом друг с другом. Как я могу это сделать, должен ли я преобразовать столбец?Как суммировать колонку строки в формате rdd?
где ваша программа? ошибки, которые вы получаете – Sachith
Вы не можете изменить тип столбца на более подходящий тип, например 'Int'? Общей хорошей практикой является наличие сильных типизированных значений, и это значительно упростит вашу проблему. –