2014-11-16 2 views
0

Я пытаюсь приписать отсутствующие значения, используя пакет mi в r, и столкнулся с проблемой.Загрузка данных с отсутствующими значениями в виде числовых данных

Когда я загружаю данные в r, он распознает столбец с отсутствующими значениями в качестве факторной переменной. Если преобразовать его в числовой переменной с помощью команды

dataset$Income <- as.numeric(dataset$Income) 

Он преобразует столбец порядковых значений (с наименьшим значением, равным 1, второй по размеру в 2, и т.д ...)

Я хочу для преобразования этого столбца в числовые значения, сохраняя исходные значения переменной. Как я могу это сделать?

EDIT: Поскольку люди спрашивали, вот мой код и пример того, как выглядят данные.

ДАННЫЕ:

96 GERMANY 6 1960 72480 73 50.24712 NA 0.83034767 0 
97 GERMANY 6 1961 73123 85 48.68375 NA 0.79377610 0 
98 GERMANY 6 1962 73739 98 48.01359 NA 0.70904115 0 
99 GERMANY 6 1963 74340 132 46.93588 NA 0.68753213 0 
100 GERMANY 6 1964 74954 146 47.89413 NA 0.67055298 0 
101 GERMANY 6 1965 75638 160 47.51518 NA 0.64411484 0 
102 GERMANY 6 1966 76206 172 48.46009 NA 0.58274711 0 
103 GERMANY 6 1967 76368 183 48.18423 NA 0.57696055 0 
104 GERMANY 6 1968 76584 194 48.87967 NA 0.64516949 0 
105 GERMANY 6 1969 77143 210 49.36219 NA 0.55475352 0 
106 GERMANY 6 1970 77783 227 49.52712 3,951.00 0.53083969 0 
107 GERMANY 6 1971 78354 242 51.01421 4,282.00 0.51080717 0 
108 GERMANY 6 1972 78717 254 51.02941 4,655.00 0.48773913 0 
109 GERMANY 6 1973 78950 264 50.61033 5,110.00 0.48390087 0 
110 GERMANY 6 1974 78966 270 48.82353 5,561.00 0.56562229 0 
111 GERMANY 6 1975 78682 284 50.50279 6,092.00 0.56846030 0 
112 GERMANY 6 1976 78298 301 49.22833 6,771.00 0.53536154 0 
113 GERMANY 6 1977 78160 321 49.18999 7,479.00 0.55

Код:

Income <- dataset$Income 

дает мне переменный фактор, так как есть числовые апертуры в data.If я стараюсь, чтобы превратить его в числовой с

as.numeric(Income) 

Отбрасывает исходные значения и заменяет их рангами столбца. Я хотел бы сохранить исходные значения, сохраняя при этом отсутствующие значения.

+0

Как отображаются отсутствующие значения и наблюдаемые значения? Можете ли вы показать нам несколько строк вашего набора данных? –

+0

Я связал набор данных в комментарии Фила ниже, пропущенные значения представлены как na, хотя я пробовал его, сохраняя na и просто оставляя пустое пространство. –

ответ

0

Проблема, с которой сталкивается каждый менеджер данных из Германии: столбец с номерами костей с номерами двоеточий NA. Но R знает только английский стиль десятичных точек без группировки цифр. Таким образом, этот столбец рассматривается как условно масштабированная символьная переменная.

Попробуйте удалить двоеточия, и вы получите числовые значения.

Кстати, даже если мы пишем десятичные двоеточия в Германии, цифры вроде 3,951.00 синтаксически не имеют смысла. Они даже не имеют смысла на других языках. См. these examples международный синтаксис чисел.

Смежные вопросы