2017-02-05 5 views
0

У меня есть набор данных, как показано ниже:подсчет частоты точных строк

Col1. Col2. Col3.  Col4 
A  123  D   J 
B  234  E   M 
A  234  D   J 

Мне нужно добавить 5-й столбец, который имеет счетчик частоты точных совпадений на только столбцах COL1 col3 и COL4 точно.

Ожидаемый результат:

Col1. Col2. Col3.  Col4. Col5 
A  123  D   J.  2 
B  234  E   M.  1 
A  234  D   J.  2 

ответ

1

вы можете использовать groupby + transform('count'):

In [70]: df['Col5'] = df.groupby(['Col1','Col3'])['Col2'].transform('count') 

In [71]: df 
Out[71]: 
    Col1 Col2 Col3 Col4 Col5 
0 A 123 D J  2 
1 B 234 E M  1 
2 A 234 D J  2 
Смежные вопросы