Я знаю, как отбросить строку из DataFrame, содержащей все значения NULL или один null, но вы можете удалить строку на основе нулей для указанного набора столбцов?Удалить строку на основе нулей в определенных столбцах (pandas)
Например, я использую данные, содержащие географическую информацию (город, широту и долготу), а также множество других полей. Я хочу сохранить строки, которые, как минимум, содержат значение для города OR для lat и long, но отбрасывают строки, которые имеют нулевые значения для всех трех.
У меня возникли проблемы с поиском функций для этого в документации pandas. Любые рекомендации будут оценены.
Мат, это в документации. Проверьте справку по функции [dropna] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.dropna.html) –
@GeneBurinsky, no, 'dropna()' будет работать некорректно в этом случае. Проверьте строку с индексом '4' в моем примере. 'df.dropna (subset = ['city', 'latitude', 'longitude'], how = 'all')' отбросит его ... – MaxU
@MaxU, это справедливая точка. Однако, по крайней мере для вашего примера, это будет работать 'df.dropna (axis = 0, subset = [['city', 'longitude', 'latitude']], thresh = 2)', но в целом вы правильные, явные логические утверждения для желаемого превосходят решение 'dropna' –