Я пытаюсь отобразить RStudio (используя функцию View
) и записать в CSV (используя функцию write.csv
), японские символы, которые я читаю из таблицы.RStudio и японские символы
Ниже приведен пример заимствован из этого вопроса:
dfJap = read.table(header = TRUE, sep = ',', text = 'category,desc,otherdesc,volume
UPC - 31401 Age Itameabura,かどや製油 純白ごま油,OIL_OTHERS_SML_ECO,83.0
UPC - 31401 Age Itameabura,オレインリッチ,OIL_OTHERS_MED,137.0
UPC - 31401 Age Itameabura,TVキャノーラ油,OIL_CANOLA_OTHERS_LRG,3026.0',
fileEncoding = 'ISO-2022-JP')
View(dfJap)
Это показывает вывод с помощью Кодировки UTF-8, а не сам символ глифа. Интересно, является ли это проблемой ОС. Моя платформа - 64-битная Windows 7 Pro.
Вот информация сессии:
> sessionInfo()
R version 3.0.1 (2013-05-16)
Platform: x86_64-w64-mingw32/x64 (64-bit)
locale:
[1] LC_COLLATE=English_United States.1252
[2] LC_CTYPE=English_United States.1252
[3] LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C
[5] LC_TIME=English_United States.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] plyr_1.8 gtools_3.1.1 ggplot2_0.9.3.1
loaded via a namespace (and not attached):
[1] colorspace_1.2-4 dichromat_2.0-0 digest_0.6.4
[4] grid_3.0.1 gtable_0.1.2 labeling_0.2
[7] MASS_7.3-26 munsell_0.4.2 proto_0.3-10
[10] RColorBrewer_1.0-5 reshape2_1.2.2 rstudio_0.98.484
[13] scales_0.2.3 stringr_0.6.2 tools_3.0.1
Это может быть проблема локали, как описано [в этом вопросе] (http://stackoverflow.com/questions/11069908/r-extracting-clean-utf-8-text-from-a-web-page-scraped -с-RCurl). [Это] (http://stackoverflow.com/questions/11228307/writing-data-isnt-preserving-encoding) находится в том же духе. – SlowLearner