У меня возникли трудности с импортом листа excel в R (csv). Однако после прочтения этого post я смог успешно импортировать его. Тем не менее, я заметил, что некоторые цифры в конкретном столбце превратились в нежелательные символы - «52,386,43» «Ï6,887.61» «32 923,45». Любые идеи, как я могу изменить их на цифры?Изменение кодировки файла в R
Вот мой код ниже:
df <- read.csv("data.csv", header = TRUE, strip.white = TRUE,
fileEncoding="latin1", stringsAsFactors=FALSE)
Я также попытался fileEncoding = "UTF-8"
, но это не работает-я получаю следующее предупреждение:
Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote, :
invalid input found on input connection 'data.csv'
2: In read.table(file = file, header = header, sep = sep, quote = quote
Я использую макинтош с «R версия 3.2.4 (2016-03-10)» (если это имеет значение). Вот первые десять записей из пораженной колонки:
[1] "Ï52,386.43" "Ï6,887.61" "Ï32,923.45" "" "Ï82,108.44"
[6] "Ï6,378.10" "" "Ï22,467.43" "Ï3,850.14" "Ï5,547.83"
Извините, я имею в виду предупреждение, отредактированное. –
Вы можете скопировать некоторую строку из своего файла? очень сложно помочь вам без данных – agstudy
Я ценю это, я постараюсь добавить это. –