У меня есть 6 столбцов в моей кадре данных. 2 из них имеют около 3K уникальных значений. Когда я использую get_dummies()
на всем фрейме данных или только один из двух столбцов, то получится тот же самый столбец со значениями 3k. get_dummies
не подходит для больших столбцов. Некоторые столбцы действительно разогреваются, но большие нет.Ограничение Python Pandas get_dummies(). Не конвертирует все столбцы
Интересно, работает ли get_dummies только на множестве с малой мощностью.
Я считаю, что это было также обсуждается здесь: Need help with python(pandas) script
Что такое dtypes? Если этот столбец с уникальными значениями 3k имеет тип integer, он будет отброшен в pd.get_dummies, да. Вы можете преобразовать его в категорию и применить pd.get_dummies ('df ['x'] = df ['x']. Astype ('category')'). Если количество уникальных значений невелико по сравнению с длиной блока данных, оно будет использовать значительно меньше памяти. – ayhan
ах это была ошибка! Эти большие столбцы являются int (такие факторы, как R). Я изменю тип! Благодаря !! – cryp