Предположим, что у меня есть Панды DataFrame называется df
с колоннами a
и b
и то, что я хочу, это число различных значений b
на каждый a
. Я бы сделал:Панды отчетливый отсчет как DataFrame
distcounts = df.groupby('a')['b'].nunique()
, который дает желаемый результат, но он как объект Серии, а не другой DataFrame. Вместо этого я бы хотел использовать DataFrame. В обычном SQL я бы сделал:
SELECT a, COUNT(DISTINCT(b)) FROM df
и не смог точно подражать этому запросу в Pandas. Как?
Вы можете назвать 'reset_index()' на результат: 'distcounts = df.groupby ('a') ['b']. nunique(). reset_index()' или просто преобразовать в df: 'distcounts.to_fra я() ' – EdChum