2016-10-29 3 views
0

Когда я называю мой кадр данныхGroupBy() функция панд работающих неправильно

third_class.head() 

Вот как это выглядит:

Pclass  Fare Survived Fare Kind Counts 
0 3  7.2500  0   Lowest  1 
2 3  7.9250  1   Low  1 
4 3  8.0500  0   Low  1 
5 3  8.4583  0   Medium  1 
7 3  21.0750  0   high  1 

Я хотел, чтобы сгруппировать мои данные в соответствии с выжила и Fare Kind, Я использовал следующий код

third_class_grouped =third_class.groupby(["Survived","Fare Kind"], as_index=False)["Counts"].sum() 

Это выход я получаю для

third_class_grouped.head() 

         Survived Fare Kind Counts 
Survived Fare Kind   
    0  Lowest  NaN  NaN  NaN 
       Low   NaN  NaN  NaN 
       Medium  NaN  NaN  NaN 
       high  NaN  NaN  NaN 
    1  Lowest  NaN  NaN  NaN 

Как исправить свой код, чтобы получить суммы в месте Нэн в импульсах колонках и заставить Выжил и Fare вид из индекса

ответ

0

Попробуйте что-то вроде этого.

sums = third_class.groupby(["Survived","Fare Kind"]).sum() 
sums['Counts'].reset_index() 

Я нахожу, что просто суммирование всего, а затем выбор агрегации после того, как его легче понять.

+0

Спасибо за быстрый и точный ответ, который исправил ошибку –

Смежные вопросы