можно преобразовать столбец панды строки в категоричен, но когда я пытаюсь вставить его в новом столбце DataFrame, кажется, преобразуются обратно в серию ула:Как сгенерировать столбец данных Pandas DataFrame из категориального столбца строки?
train['LocationNFactor'] = pd.Categorical.from_array(train['LocationNormalized'])
>>> type(pd.Categorical.from_array(train['LocationNormalized']))
<class 'pandas.core.categorical.Categorical'>
# however it got converted back to...
>>> type(train['LocationNFactor'][2])
<type 'str'>
>>> train['LocationNFactor'][2]
'Hampshire'
Гадания это потому, что категоричные Безразлично» t отображает любой numpy dtype; поэтому мне нужно преобразовать его в некоторый тип int и, таким образом, потерять метки факторов < -> levels association? Какое самое элегантное обходное решение для хранения уровней < -> ассоциация ярлыков и удержать возможность конвертировать назад? (Просто хранить в Словаре как here и вручную преобразовать в случае необходимости?) я думаю Categorical is still not a first-class datatype for DataFrame, в отличие от Р.
(Использование панд 0.10.1, NumPy 1.6.2, Python 2.7.3 - последние версии MacPorts все).
Я знаю, что, но проблема здесь все это получает взорвано обратно к Силе, когда мы относим к колонку DataFrame, как я показал: 'поезда [«LocationNFactor» ] = pd.Categorical ... ' – smci