У меня есть набор данных, образованный некоторыми текстовыми столбцами (с ограниченными возможностями) и некоторыми числовыми столбцами в формате csv. Есть ли способ автоматического преобразования текстовых столбцов в числа (например: A будет 0, B будет 1 и т. Д.), Чтобы преобразовать набор данных в np.array
?python - преобразовать данные в массив numpy для sklearn
Это будет позже использовано на scikit-learn
, поэтому оно должно быть np.array
в конце всей обработки.
EDIT: Добавление одной строки набора данных:
ENABLED;ENABLED;10;MANUAL;ENABLED;ENABLED;1800000;OFF;0.175;5.0;0.13;OFF;NEITHER;ENABLED;-65;2417;"wifi01";65;-75;DISCONNECTED;NO;NO;2621454;432477;3759;2.2436838539123705E-6;
Можете ли вы дать нам пример (отрывок) из файла (или «текстовые столбцы»), так что мы можем лучше понять, с чем вы работаете? 'genfromtext'' numpy' может быть хорошим местом для начала или, возможно, 'pandas.read_csv' ... – mgilson
Добавлен к описанию. Каждый текстовый столбец может иметь 3 или 4 возможных значения. – Minoru