2013-08-07 4 views
2

Я пытаюсь читать csv файл, созданный с помощью SQL Server Management Studio и зашифрованную UTF-8 (я выбрал этот вариант, при сохранении его) в R версии 3.0.1 (x64) через read.csv2(). Я не могу R правильно отображать специальные символы.Кодировка символов в R

Если я установил fileEncoding="UTF-8-BOM", останавливается импорт на линии, где у меня есть ÿ. Однако при открытии файла в Notepad++ ÿ отображается правильно с кодировкой UTF-8. Я пробовал без установки fileEncoding, но тогда специальные символы отображаются неправильно (конечно).

CSV-flie доступна здесь: https://www.dropbox.com/s/7y47i826ikq8ahi/Data.csv

Как прочитать файл CSV и отображать текст в правильном кодировании?

Спасибо!

ответ

2

Я нашел ответ сам. Проблема заключалась в трансформации из UTF-8 в локаль системы (кодировка по умолчанию в R) до fileEncoding. Когда я использую RStudio, я просто изменил кодировку по умолчанию на UTF-8 и удалил fileEncoding="UTF-8-BOM" с read.csv. Затем весь файл csv был прочитан, и RStudio правильно отображает все символы.

0

Тем, кто все еще придерживается этой проблемы. Мои скрипты смогли распознать «umlaute» (ä, ö, ü или ß), включив в верхнюю часть скрипта строку, которая меняет параметр по умолчанию для кодировки символов options(encoding = "UTF-8") (В моем случае настройка параметров в RStudio direclty didn ' t влияют на кодировки!).

Смежные вопросы