Переменная Language
содержит 33 различных языковФакторинговые переменные в R
factor_language_var <- factor(Data$Language)
summary(factor_language_var)
ar ca cs da de el en en-gb en-GB es fi fr hi hu id it ja
4 5 4 5 231 1 12067 229 2 121 8 206 2 2 34 45 48
и т.д ...
Если я просто фактор переменной, очевидно, создает 33 уровней, которые мне не нужны. Как конкретно выбрать языки (значения) и создать уровень из них?
В частности, мне нужны en
, en-gb
и en-GB
(английский) для формирования Уровня 1; nl
(голландский) - Уровень 2; msa
(малайский) - Уровень 3; ru
(русский) - Уровень 4; и все другие языки, объединенные в качестве ссылочной категории.
Спасибо.
Как и мой (теперь удаленный) ответ, это clobbers значения NA. Я еще не понял пути. – thelatemail
Когда я помещал NA на входы, я получаю «Все остальные» (который, я полагаю, может или не желателен.) Я отправлю альтернативу: –
@BondedDust Спасибо! Это сложнее, чем я ожидал. НС не проблема, так как я очищал свои данные заранее. – Zlo