Учитывая список особенностей длины варианта:Как использовать функции длины одного горячего кодирования?
features = [
['f1', 'f2', 'f3'],
['f2', 'f4', 'f5', 'f6'],
['f1', 'f2']
]
, где каждый образец имеет вариант количество функций и функцию dtype
является str
и уже один горячий.
Для того, чтобы использовать мнемонические утилиты sklearn, я должен преобразовать features
в 2D-массив, который выглядит как:
f1 f2 f3 f4 f5 f6
s1 1 1 1 0 0 0
s2 0 1 0 1 1 1
s3 1 1 0 0 0 0
Как я могу добиться этого с помощью sklearn или NumPy?