Я использую кодировщик меток для преобразования категориальных данных в числовые значения.Отсутствие значений кодировки метки-кодировщика
Как LabelEncoder обрабатывает отсутствующие значения?
from sklearn.preprocessing import LabelEncoder
import pandas as pd
import numpy as np
a = pd.DataFrame(['A','B','C',np.nan,'D','A'])
le = LabelEncoder()
le.fit_transform(a)
Выход:
array([1, 2, 3, 0, 4, 1])
Для приведенного выше примера, метка датчика изменилось NaN значения к категории. Как я узнаю, какая категория представляет недостающие значения?
Таким образом, вы бы кодирования «NaN» в качестве фиктивного значения? У меня такая же проблема, но я хочу использовать условное значение для линейной регрессии. –