2015-06-20 8 views
1

У меня есть 12064 строки x 220 столбцов csv-файл с некоторыми нулевыми значениями, записанными в форме '\ N'. Я читаю данные CSV в панде dataframe через: df = pd.read_csv('my_csv')Как удалить ' N' значения null из csv из pandas dataframe

Каков наилучший способ лечения/удалить нулевые значения, так что я могу выполнять вниз по течению анализа по данным? Я думаю, возможно, было бы лучше всего преобразовать строку «\ N» в «NaN» и использовать метод df.dropna(). Если это лучший вариант, как мне это сделать? Благодарю.

+0

Вы пробовали 'na_values'? –

ответ

2

Я думаю, возможно, было бы лучше, чтобы преобразовать строку «\ N» к «NaN» и использовать df.dropna метод

pandas.read_csv()() имеет параметр только для этого

na_values : list-like or dict, default None 
Additional strings to recognize as NA/NaN. If dict passed, specific per-column NA values 

Так, например,

pandas.read_csv('my.csv', na_values=['\N']) 

Тогда вы можете легко использовать dropna() на нем

реф, http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

Смежные вопросы