2016-08-17 6 views
0

У меня возникли трудности с импортом листа excel в R (csv). Однако после прочтения этого post я смог успешно импортировать его. Тем не менее, я заметил, что некоторые цифры в конкретном столбце превратились в нежелательные символы - «52,386,43» «Ï6,887.61» «32 923,45». Любые идеи, как я могу изменить их на цифры?Изменение кодировки файла в R

Вот мой код ниже:

df <- read.csv("data.csv", header = TRUE, strip.white = TRUE, 
       fileEncoding="latin1", stringsAsFactors=FALSE) 

Я также попытался fileEncoding = "UTF-8", но это не работает-я получаю следующее предупреждение:

Warning messages: 
1: In read.table(file = file, header = header, sep = sep, quote = quote, : 
       invalid input found on input connection 'data.csv' 
       2: In read.table(file = file, header = header, sep = sep, quote = quote 

Я использую макинтош с «R версия 3.2.4 (2016-03-10)» (если это имеет значение). Вот первые десять записей из пораженной колонки:

[1] "Ï52,386.43" "Ï6,887.61" "Ï32,923.45" ""   "Ï82,108.44" 
[6] "Ï6,378.10" ""   "Ï22,467.43" "Ï3,850.14" "Ï5,547.83" 
+0

Извините, я имею в виду предупреждение, отредактированное. –

+1

Вы можете скопировать некоторую строку из своего файла? очень сложно помочь вам без данных – agstudy

+0

Я ценю это, я постараюсь добавить это. –

ответ

0

Оказывается, этот вопрос был знаком фунта, который переоделся в Ï в процессе сохранения файла XLS в формат CSV (в окнах открыты в макинтош). Спасибо за ваши ответы.

Смежные вопросы