Есть ли операция в пандах, которая делает то же самое, что и flatMap в pyspark?pyspark's flatMap in pandas
flatMap пример:
>>> rdd = sc.parallelize([2, 3, 4])
>>> sorted(rdd.flatMap(lambda x: range(1, x)).collect())
[1, 1, 1, 2, 2, 3]
До сих пор я могу думать о apply
с последующим itertools.chain
, но мне интересно, если есть один шаг решение.
Если это чисто панды вопрос, то это помогло бы более полно объяснить, что вы пытаетесь сделать (для людей, не знакомых с flatMap, что может быть много людей, здесь!) , Пример данных, желаемых результатов и т. Д. – JohnE