Я использую pandas как замену db, поскольку у меня есть несколько баз данных (oracle, mssql и т. Д.), И я не могу сделать последовательность команд эквивалентом SQL.Pandas count (отдельный) эквивалент
У меня есть таблица, загруженная в DataFrame с некоторыми столбцами:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
В SQL для подсчета количества различных клиентов в год будет:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
И результат будет
201301 5000
201302 13245
Как я могу это сделать в пандах?
Я сделал table.groupby ([ «годМесяц»]) [ «CLIENTCODE»] Уникальный() и пришел с двумя рядами индексируется годМесяц и со всеми уникальными значениями.. Как подсчитать количество значений в каждой серии? –
Для некоторых, 'value_counts' может быть ответом, который вы ищете: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.value_counts.html –