У меня есть ряд переменных в наборе данных, которые являются a) разреженными и b) уникальными (в основном ...). Что-то вроде этого:Кодирование scikit-learn для «Null/Not Null»?
Foo NaN NaN Bar NaN NaN NaN Baz
Хотя фактическое значение этих переменных интересно в некоторых контекстах, я часто просто заменив их True/False для Null/Не Null.
Мне было интересно, существует ли это как кодировщик для scikit-learn - и если это не так, есть ли у кого-нибудь представление о том, как его реализовать?
np.isnan (массив)? или pd.notnull() в зависимости от типа объекта, который вы используете для представления ваших данных. – stellasia