Я всегда конвертирую файл excel в CSV-файл для импорта в R, как показано ниже.Как читать файл excel по-китайски [R]?
myDataFrame <- read.csv("mydatafile.csv", stringsAsFactors=F)
Но у меня возникла серьезная проблема, когда я конвертирую файл xlsx, который написан на китайском языке. Большинство персонажей (не все из них) показывают '??' из-за кодирования.
Итак, я решил использовать импортный импортный пакет xlsx
. Но проблема в том, что размер файла excel превышает 10 МБ. Он дал мне сообщение об ошибке из-за ограничения памяти JVMs. (Я предполагаю, что xlsx
использует Java внутренне.)
Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, :
java.lang.OutOfMemoryError: GC overhead limit exceeded
Как я могу импортировать китайский первенствует файл в R? Я попробовал файл «Сохранить как ..» CSV и открыл его блокнот и сохранил его с опцией «UTF-8». но результат был тот же (показывает '??').
FYI, я могу видеть полный китайский символ в оригинальном файле excel.
Мне кажется, что вы еще не сделали то, что казалось бы очевидным: [r] китайская кодировка –
Это даже не вопрос о R? Если речь идет о чтении в R, отлично, с удовольствием помогите, но проблема с плакатом заключается в том, что он не может экспортировать книгу Excel в CSV в правильной кодировке. Наверняка это проблема Excel и/или ОС? – SlowLearner
[Этот вопрос] (stackoverflow.com/questions/4221176/excel-to-csv-with-utf8-encoding) содержит много полезных ответов на сохранение файлов Excel в виде текста UTF-8 или других промежуточных форматов, таких как UTF-16 на способ получения текстового файла UTF-8. – SlowLearner