2017-02-22 7 views
0

У меня есть некоторые твиты, хранящиеся в файле csv на моем локальном компьютере. Есть 1248 строк. Теперь, когда я пытаюсь прочитать эти твиты в R, используя функцию read.csv, я получаю 1816 строк. Это происходит потому, что в них есть некоторые твиты, у которых есть запятые, поэтому в основном то, что read.csv делает, это разделение одного твита на несколько твитов на основе количества запятых и, следовательно, большего количества строк. Итак, какой разделитель следует определить для правильного чтения файла?Пытается прочитать твиты в R, хранящиеся в файле csv

Благодаря

+0

попытаться поставить кавычки вокруг текстовых полей при построении csv – HubertL

+0

Итак, вы сами создаете этот файл? Вместо этого попробуйте использовать 'tab' в качестве разделителя. Но на самом деле вы ничего не можете гарантировать, что это не будет в чириканье. Файлы CSV могут содержать запятые в значениях, если они правильно экранированы или ограничены. Возможно, для создания файла используйте собственный файл CSV. – MrFlick

+1

Показать данные. В противном случае это предположение. – lukeA

ответ

0

преобразования CSV файл XLSX и использовать следующий код:

библиотека (readxl) набор данных < - read_excel ('C:/Исследование /..._ Sample1.xlsx')

Смежные вопросы