У меня есть запрос. В Pyspark, когда нам нужно получить общее (SUM) на основе (Key, Value), наш запрос читается как:Pyspark - Max/Min Parameter
RDD1 = RDD.reduceByKey(lambda x , y: x + y)
, где, как, когда нам нужно найти MAX/значение MIN для (Key, Value) наш запрос читается как
RDD1 = RDD.reduceByKey(lambda x , y: x if x[1] >= y[1] else y)
Почему, когда мы Просуммировать данные не используя x[1]
, Y[1]
, где, как же является использование для MAX/MIN ?. Просьба уточнить сомнения.
Rgd-х