2015-10-28 2 views
0

Я читаю данные с веб-сайта с текстом, обозначающим каждую строку. Я просто скопировал и вложил данные в Excel, и файл затем читается R. Одна из этих строк содержит название немецкого города «Вюрцбург», которое включает в себя нижний регистр u с умляутом. У меня нет проблем с просмотром специального символа в Интернете или в Excel. Проблема в том, что когда это слово передается ggplot2, оно отображается на графике как «W & Atilde; zburg», с тильдой над столицей A. RStudio показывает обе формы в зависимости от области, в которой она отображается. Я бы предположил, что ggplot2 использует другой язык для интерпретации специальных символов.Использование ggplot2 и специальных символов

Есть ли способ рассказать ggplot, как читать, интерпретировать и отображать специальные символы? Я не хочу писать специализированный код только для этого города, но для решения проблемы в целом. Я могу столкнуться с другими символами, поскольку данные расширяются с течением времени.

+0

Возможно, вам нужно рассмотреть представление юникода для ваших строк. [Здесь] (http://stackoverflow.com/questions/29265172/print-unicode-character-string-in-r) является связанной записью. Возможно, вам понадобится [это] (http://www.alanwood.net/unicode/latin_1_supplement.html) –

ответ

2

Прочитайте файл следующего

library('data.table') 
fread('path_to_file', ..., encoding = 'UTF-8') 
+0

Спасибо! Я добавил кодировку для read.xlsx, и она отлично работала. Это может быть широко доступно. –

1

я встретил подобную ошибку с ggplot2, когда я использовал жёстко data.frame (то есть, я хотел бы написать Großbritannien (Великобритания), и было бы получить закодирован в какой-то бред).

Мое решение было включить

Sys.setlocale("LC_ALL", "German") 
options(encoding = "UTF-8") 

в начале сценария.

+0

Спасибо. Это хорошо знать. –

0

Мое решение этой проблемы переключается на cairo для построения pdf-графика. Все специальные символы отображаются корректно с помощью ggplot2. Достаточно поместить эту строку кода между настройками knitr:

knitr::opts_chunk$set(dev='cairo_pdf') 
+0

Спасибо. Это похоже на ценный ресурс. –

Смежные вопросы