2016-09-30 1 views

ответ

2

В предварительных обработках (CsvFeatures), использование:

features.categorical («passenger_count»)

Вы можете также передать в частотном пороге, чтобы избежать значений одного горячего кодирования, которые происходят слишком редко в данные.

4

Обратите внимание, что вам нужно немного больше, чтобы выбрать желаемое представление - одно из k (или одно горячее) или разреженное.

features.categorical('passenger_count').one_of_k() 

Примечание стороны, вы также можете быть заинтересованы в числовых столбцах, а также возможность применять журнал (часто полезно для подсчета типа функций) или дискретностью через bucketing.

Смежные вопросы