У меня есть dataframe, который выглядит, как этотPython GroupBy опускает столбцы
дг:
thing1 thing2 thing3 thing4 thing5 thing6 thing7 ID
NAN 1 NAN NAN NAN NAN NAN 222
NAN NAN 3 NAN NAN NAN NAN 222
NAN NAN NAN 2 NAN NAN NAN 222
3 NAN NAN NAN NAN NAN 3 222
NAN NAN NAN NAN NAN NAN NAN 222
NAN NAN NAN NAN 4 NAN NAN 222
NAN NAN NAN NAN NAN 4 NAN 222
NAN 3 NAN 2 NAN NAN NAN 555
NAN NAN 3 NAN NAN NAN NAN 555
NAN NAN NAN NAN NAN NAN NAN 555
, когда я делаю GroupBy так:
dg = dg.groupby('ID').max().reset_index()
производит следующий вывод, опуская две колонны, такие как:
ID thing2 thing3 thing4 thing5 thing7
222 1 3 2 4 3
555 3 2
dataframe следует, что образец, но я не знаю, почему две колонки опущены
значения NAN являются np.nan
Что такое вывод для 'dg.dtypes'? Являются ли недостающие столбцы определенно численными? –
actallly Я обнаружил, что некоторые значения являются строковыми значениями «N/A», я постараюсь заменить их – Kalimantan
. Вот и все! была случайная строка «N/A» в середине всех значений np.nan, что затрудняло обнаружение ошибки – Kalimantan