2015-11-19 2 views
1

Мне нужно прочитать файл xls в R. Но проблема связана со специальным символом/изображениями.Импорт файла xls со специальным символом/изображением/знаком

В моем файле данных xls имеется около 10000 строк, но он будет читать только до 7000, отсюда будет только этот специальный символ (появляется знак клавиатуры слева.) У меня нет альтернативных вариантов для преобразования xls/замените этот специальный character.please, помогите мне в этом.
Ваша поддержка высоко оценил

данных выглядит следующим образом:

V1  V2  V3 
1.choco,Crack,Foodies 
2.choco,Crack,Foodies 
3.Flakes,Flakes,Foodies 
4.Flakes,Flakes,Foodies 
5.Flakes,Flakes,Foodies 
6.Surrain,Surrain,Tango->lilly 
7.Surrain,Surrain,Tango->lilly 

Мой код:

read.xls(df.xls,sheet=1,blank.lines.skip=T,skip=2,header=F,strip.white=F,as.is=T) 

выход я получил:

V1 V2 V3 
1.choco,Crack,Foodies 
2.choco,Crack,Foodies 
3.Flakes,Flakes,Foodies 
4.Flakes,Flakes,Foodies 
5.Flakes,Flakes,Foodies 
6.Surrain,Surrain,Tango 

Примечание: Стрелка знак между танго Лилли - это сам e как наша клавиша со стрелкой влево

+0

Вы пробовали библиотеку (readxl); dat <- read_excel ("file.xls") '? – David

+0

Вы также можете рассмотреть возможность использования пакета 'XLConnect'. – Konrad

+0

Если знак стрелки должен быть заменен запятой или должен быть удален вообще знак стрелки, включая lilly? –

ответ

1

Вы можете использовать fread.

library(data.table) 
dat <- fread("//path/yourfile.xls",header=F, sep=",", na.string="NA") 

head(dat) 

Выходной сигнал, в котором вся строка "Tango->lilly" сохраняется, что, конечно, может быть изменен.

#   V1  V2   V3 
#1: 1.choco Crack  Foodies 
#2: 2.choco Crack  Foodies 
#3: 3.Flakes Flakes  Foodies 
#4: 4.Flakes Flakes  Foodies 
#5: 5.Flakes Flakes  Foodies 
#6: 6.Surrain Surrain Tango->lilly 
Смежные вопросы