У меня dataframe, как показано ниже:Как подсчитать конкретные значения столбцов в python pandas?
df1_data = {'sym' :{0:'AAA',1:'BBB',2:'CCC',3:'AAA',4:'CCC',5:'DDD',6:'EEE',7:'EEE',8:'FFF'},
'identity' :{0:'AD',1:'AD',2:'AU',3:'AU',4:'AU',5:'AZ',6:'AU',7:'AZ',8:'AZ'}}
Я хочу, чтобы проверить SYM колонки в моей dataframe. Мое намерение состоит в том, чтобы сгенерировать два разных файла, один из которых содержит одинаковые два столбца в другом порядке, а второй файл содержит столбцы sym, sym_count, AD_count, AU_count, neglected_count.
Edit 1 -
Я хочу, чтобы избежать идентичности, кроме (AD & AU). В обоих выходных файлах я не хочу получить результат AD & AU. neglected_count column не является обязательным.
Ожидаемое result-
Result.csv
sym,identity
AAA,AD
AAA,AU
BBB,AD
CCC,AU
CCC,AU
EEE,AU
result_count.csv
sym,sym_count,AD_count,AU_count,neglected_count
AAA,2,1,1,0
BBB,1,1,0,0
CCC,2,0,2,0
EEE,2,0,1,1
Как я могу выполнить такой тип вычисления в питона панд?
Он работает. решение для result.csv? – kit
См. Раздел «Редактирование» 1. Требование немного изменилось для result_count.csv и result.csv. Я сказал, что о result.csv не result_count.csv. пожалуйста, внимательно прочитайте. – kit
Пожалуйста, проверьте мое решение. – jezrael