У меня есть кадр данных pandas с 83 столбцами и 4000 строк. Я намерен использовать данные для логистической регрессии и поэтому хочу сузить мои столбцы до тех, у кого наименьшее количество недостающих данных.Как получить частоту obsevations NaN в столбце dataframe pandas
Для этого я думал о ранжировании их на основе частоты наблюдений NaN. Я пробовал несколько вещей, таких как
econ_balance["BG.GSR.NFSV.GD.ZS"].describe()
econ_balance["BG.GSR.NFSV.GD.ZS"].value_counts
econ_balance["BG.GSR.NFSV.GD.ZS"]["NaN"]
econ_balance["BG.GSR.NFSV.GD.ZS"][NaN]
Ничего из этого не работает. Я всегда пробовал искать, если бы на этот вопрос был дан ответ, но не повезло.
Заранее спасибо за помощь
Джош
df.isnull(). Sum() http://stackoverflow.com/questions/26266362/how-to-count-the-nan-values-in-the-column-in-panda-data- frame –
Jeez Я неожиданно получил немедленный дубликат Закрыть – EdChum