2015-07-17 2 views
1

Я пытаюсь добавить столбец в кадр данных в R. Для этого я импортировал CSV-файл из Excel, который содержит столбец id (такой же, как тот, который у меня есть в кадре данных), и столбец с информацией, которую я хочу добавить в свой фрейм данных.читать csv файл в r с испанскими символами (', ñ)

Моя проблема заключается в том, что мои резюме имеет испанские символы (', N), и, когда я использую read.csv (как в следующем примере)

religion <- read.csv("religion.csv", header = TRUE, sep = ",", dec = ".", 
        filled =TRUE, comment.char = "", strip.white = TRUE, 
        stringsAsFactors = TRUE) 

символы не появляются, но вопрос вместо символов отображается символ.

Я попытался изменить кодировку, со следующими кодировками:

UTF-8, latin1,

Sys.setlocale("LC_ALL", "ES_ES.UTF-8") 

Но нет никакой разницы.

Я с радостью признателен за любую помощь.

+1

Что это кодировка, используемая в файле? Какую ОС вы используете? [Воспроизводимый пример] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) было бы полезно посмотреть, что происходит. – MrFlick

+0

Работает ли это 'dt <-data.table (a =" - ")'? –

+0

'fill' не является аргументом read.csv, вы имеете в виду' fill'? – mpalanco

ответ

0

Вы могли бы расширить от чего-то вроде этого:

DF<- data.frame(col1=c(1,2), col2=c("there is an ñ here", "there is an ´ here")) 
# col1 col2 
# 1  there is an ñ here 
# 2  there is an ´ here 

DF$col2 <- chartr("ñ", "n", DF$col2) 
DF$col2 <- chartr("´", "'", DF$col2) 
DF 
# col1  col2 
# 1  there is an n here 
# 2  there is an ' here 
0

Используйте encoding вариант внутри read.csv кода

religion <- read.csv("religion.csv", header = TRUE, sep = ",", dec = ".", 
         filled =TRUE, comment.char = "", strip.white = TRUE, 
         stringsAsFactors = TRUE, encoding="UTF-8") 

Помните, что вы всегда можете проверить документацию в R с помощью help(function)

Смежные вопросы