Мне нужно собрать массив внутри моего фрейма.Агрегатный массив в DataFrame с группой по
dataframe был создан таким образом
splitted.map(lambda x: Row(store= int(x[0]), date= parser.parse(x[1]), values= (x[2:(len(x))])) )
Значение является массивом
Я хочу сделать думать, как этот
mean_by_week = sqlct.sql("SELECT store, SUM(values) from sells group by date, store")
Но у меня есть следующее сообщение об ошибке
AnalysisException: u «не может разрешить« сумму (значения) »из-за несоответствия типа данных: функция sum требует числовых типов, а не ArrayType (StringType, true); линия 0 поз 0"
Массив всегда один и тот же размер. Но при каждом запуске размер может измениться, находится вблизи 100 длины.
Как можно агрегировать не заходя к РДД-х?