1
У меня есть набор данных, как этотВозьмите первые п записей из dataframe сгруппированных по уникальному идентификатору
Как вы видите, упорядочено по рейтингу и USERID мне нужно, чтобы получить новый Dataframe только с топ 2 результатов из каждой группы по уникальной user_id Я попытался
dataframe.groupBy("user_id").agg(someUdfFuntion)
Я пытался использовать функцию ранга, но это, кажется, не работает, я пытался фильтровать dataframe, но никакого результата, как я мог это сделать?
человек плз последний вопрос, как я могу сделать это же самое, но применение фильтра для каждого раздела? –
Я не понимаю, что вы имеете в виду. –
Я имею в виду, мне нужно то же самое, но вместо сокращения на n число мне нужно отфильтровать каждую группу, содержащуюся в Seq, скажем. –