Мои знания в этой области бедны, поэтому извините меня, если это тривиальный вопрос.Работа с различным количеством уровней в наборах поездов и испытаний
Мне нужно обучить модель, и у меня есть два набора данных: данные поезда для построения модели и данные оценки для применения модели на ней.
Одна важная категориальная переменная имеет 200 уровней в данных поезда и имеет только 50 уровней в данных скоринга. На самом деле они разделяют только 20 уровней.
Итак, каков правильный способ справиться с такой ситуацией? следует ли ограничивать уровни пересечением уровней или сохранять их как это или что? Bests.
Довольно уверены, что они говорят о категорическом var, а не непрерывном. Хотя я мог ошибаться. – Frank