2015-09-16 4 views
0

Я изучаю этот вопрос, который, как я полагаю, должен быть легко исправить, но мне не повезло. У меня есть файл excel, где каждая ячейка представляет собой текст переменной длины. Я хочу прочитать это в R, чтобы в конечном итоге сделать некоторую текстовую классификацию, но не могу. Я получаю ошибки при использовании read.table и борюсь со всеми другими альтернативами. Я никогда не работал с текстовыми данными, поэтому, возможно, это моя проблема. У вас проблемы с поиском хороших примеров импорта текстовых данных в R, если он не находится в формате corpus.Excel текстовые данные в R

+0

проверить пакет 'xlsx', но я думаю, что он работает только для версий Excel <= 2007 – pcantalupo

ответ

3

Существуют специальные пакеты для чтения данных из формата excel. В основном я использую readxl, когда мне нужно это сделать, но я знаю, что их несколько (многие из них описаны в this tutorial by datacamp, в разделе «Импорт файлов Excel в R»).

Другая возможность (если вы используете окна), чтобы скопировать ячейки в буфер обмена и использовать

read.table("clipboard") 

для MacOS и Linux есть подобные команды, но я не знаю их наизусть.

+1

. Затем есть экспорт из Excel в качестве опции CSV, за которым следует' read.csv' –

+0

Хотя это, безусловно, вариант, я считаю, что мой жесткий диск забивается csv-файлами через некоторое время, и я не знаю, какие из них актуальны. Я предпочитаю работать непосредственно с файлом excel. – DGKarlsson

+0

Пакет [xlsx] (https://cran.r-project.org/web/packages/xlsx/xlsx.pdf) также может быть полезен. – Badger

Смежные вопросы