Допустим, у меня есть данные, как показано ниже в панде dataframe:Панда Нахождение Multiple иерархия Среды
Я хотел бы найти описательные статистики (среднее, медиану, стандартное Dev) из:
- уникальных пользователей в когорте
- комментариев на одного пользователя в группе
- комментариев в когорте
Так что для выхода, я ожидал увидеть:
- уникальных пользователей в когорте -> [{а: 3}, {Ь: 2}, ...], а затем найти описательную статистику для серии
- комментариев для каждого когорты -> [{(a, alex): 2}, {(b, alex): 0}, {(a, beth): 1}, {(b, beth) : 3} ...]
- комментариев в когорту -> [{а: 5}, {Ь: 6} ...]
Я использую панда, и я абсолютно застрял на как сделать что-то так просто. Я думал об использовании .groupby()
, но это не дало ясного решения. Я мог бы сделать это без Панд, но я думал, что это были вопросы, на которые был сделан набор данных Pandas !?
Спасибо!
Некоторые примеры вывода было бы полезно. – piRSquared
Добавлено то, что я хотел бы увидеть. Благодаря! – Alex
Пожалуйста, не помещайте вопросы python/pands с помощью [R], если нет веской причины. –