Ошибка при чтении файла CSV в R

У меня возникли некоторые проблемы при чтении файла CSV с R.Ошибка при чтении файла CSV в R

x=read.csv("LorenzoFerrone.csv",header=T) 

Error in make.names(col.names, unique = TRUE) : 
     invalid multibyte string at '<ff><fe>N'

Я могу прочитать файл, используя Libre офис без проблем.

Я не могу загрузить файл, потому что он полон разумной информации.

Что я могу сделать?

Настройка кодировки кажется решением проблемы.

> x=read.csv("LorenzoFerrone.csv",fileEncoding = "UCS-2LE") 
> x[2,1] 
[1] Adriano Caruso 
100 Levels: Ada Adriano Caruso adriano diaz Adriano Diaz alberto ferrone Alexey ... Zia Tina

источник

2013-08-26 Donbeo

У меня никогда не было этой ошибки раньше, но, как я могу понять из сообщения об ошибке, у вас может быть 2 столбца с тем же именем в вашем файле. – Error404

Существует решение [здесь] (http://r.789695.n4.nabble.com/Read-data-in-R-td2336018.html) – Metrics

Эй, вы правы, это похоже на работу fileEncoding = "UCS-2LE ». Я буду ждать немного раньше, чтобы закрыть вопрос, просто чтобы быть уверенным. – Donbeo

Необходимо указать правильный разделитель в аргументе sep.

источник

2014-12-12 07:28:20

Не уверен, если это полезно, но у меня была аналогичная проблема, и понял, что это потому, что мой файл «CSV» был суффикс .csv, но на самом деле был .xls файл!

источник

2014-03-20 15:40:27 fredtal

Не уверен, что это помогает, просто возникла аналогичная проблема, которую я решил, удалив «из csv, который я пытался импортировать. Первая строка базы данных имела имена столбцов, написанные как« colname »,« colname2 », «и т. д.», и я удалил все «и csv было прочитано в R просто отлично.

источник

2014-04-30 18:57:22 MarcoD

Причина - неправильная кодировка. Я решил заменить все «è» на e

источник

2015-03-18 08:43:57

Я не уверен, отвечает ли это на вопрос. – Opal

Как правило, проблема с кодировкой. Вы можете попытаться изменить кодировку или удалить оскорбительный символ (просто используйте свой любимый редактор и замените все экземпляры). В некоторых случаях R плюнет расположение обугленного, например:

недействителен многобайтовая строка 1847

Который должен сделать вашу жизнь проще. Также обратите внимание, что вам может потребоваться повторить этот процесс несколько раз (удаление всех оскорбительных символов или попыток нескольких кодировок).

источник

2015-08-25 10:50:43 AlonG

Я решил проблему, удалив любые графические знаки в письме (то есть знаки акцента). Мои заголовки были написаны на испанском языке и имели некоторые знаки акцента. Я заменил простыми словами (México = Mexico), и проблема была решена.

источник

2015-10-28 04:38:55 Mariano

Я знаю, что это старый пост, но просто хотел сказать неанглийским туземцам, что если вы используете «» в качестве десятичного разделителя,

источник

2016-11-09 11:44:20 pkpkPPkafa

Это будет читать имена столбцов, как есть, и выиграл» т возвращать ошибки:

x = read.csv(check.names = F)

Чтобы удалить/заменить проблемные символы в именах столбцов, используйте:

iconv(names(x), to = "ASCII", sub = "")

источник

2018-02-13 15:37:30

Ошибка при чтении файла CSV в R

ответ

Смежные вопросы