Пусть у меня есть эта таблица, которую я загружаю в панды DataFrame:Multiple группировка и подсчет в панд
name id ...
n1 1
n1 2
n2 3
n2 4
n2 5
...
Теперь я хочу, чтобы подсчитать количество идентификаторов для каждого уникального имени.
В SQL, я бы (поправьте меня, если ошибаюсь)
SELECT name, id, COUNT(*)
FROM table
GROUP BY name, id;
Как бы я добиться того же с панды? Это:
df.groupby(['name', 'id'])['name', 'id'].count()
дает мне отдельные счетчики имен и идентификаторов.
В SQL вы должны' GROUP BY имя, id' на конец вашего запроса. – jarlh
И я не знаю панд, но в дополнение к тому, что сказал jarlh, я думаю, вы не должны группироваться по счету, только имя и идентификатор. – sagi
@jarlh жаль, что я забыл написать это, исправлено. –