2010-09-26 2 views
3

Какой из форматов набора данных, перечисленных в this link, проще всего загружать для обработки в R? Несколько минут с текстовым редактором должно быть достаточно, чтобы превратить текстовую версию в литеральные данные, но может ли одна из других форм быть загружена менее чем за счет O (n) усилий пользователя?Каков предпочтительный источник данных для программ R?

Я нашел это laundry list of IO options, но он не кажется особенно полезным.


P.s. Я никогда не использовал R до и trying to help a friend, который должен это сделать.

+0

См Ответ Джошуа - это ответ - и код - вы ищете. Текстовые файлы с связанного с вами веб-сайта разделены табуляцией, поэтому я бы пошел на read.delim («CH0x_file.txt»). Друг сохраняет данные позже в формате R (см. справку (save) и help (load) в R). Это загружается значительно быстрее, так как это двоичный формат. –

ответ

4

Захватите текстовые файлы и следуйте инструкциям в spreadsheet-like data section от R Data Import/Export. Я бы не пытался читать из файлов Excel, если вам абсолютно не нужно.

Это может быть так же просто, как:

x <- read.table("file.txt", header=TRUE, sep="\t") 
# or 
x <- read.delim("file.txt") # header=TRUE and sep="\t" are already defaults 
4

Если все остальное не удается, почему бы не прочитать the manual devoted to Data Import/Export?

Вы можете импортировать данные из

  • ASCii файлов с какой разделитель (CSV, TXT ...)
  • фиксированной формы файлы
  • двоичные файлы в различных форматах (hdf5, NetCDF, .. .)
  • таблицы, в большинстве форматов даже на не-Windows платформах
  • базы данных (DBI, RODBC, ...)
  • веб-страниц (с использованием XML пакета)
  • веб-услуги, такие как SOAP, JSON, ...
  • непосредственно из других программ с использованием соединений, ...
  • и более

поэтому вызов любой один из них предпочитает - это все зависит от задачи.

+0

Я посмотрел на него, проверьте мою вторую ссылку. вероятно, мог бы выяснить, как это сделать, но для этого мне придется 1) установить R, 2) изучить некоторые из R 3) выяснить, о чем говорит эта страница, и 4) написать что-то с нуля для человека, которого я пытаюсь помочь, потому что я знаю, что страница не поможет им. – BCS

+0

Что касается задачи, я предполагаю, что они собираются проанализировать данные. Возникает вопрос: какой конкретный список форматов, который можно скачать, проще всего загружать. – BCS

+0

@ Dirk, ваш ответ можно было бы интерпретировать как смелый. Я определяю все элементы вопроса, которые могут вызвать враждебность. Я предлагаю, чтобы, если вы чувствуете враждебность, вы пропускаете вопрос. – Farrel

1

из вариантов у вас есть в наличии, табуляцией текстовые файлы являются самым простым для импорта. Далее следуют файлы SPSS, а затем все остальное. Я согласен с другими плакатами, избегать файлов с .xls (или преобразовать один из листов книги в TSV, CSV

Внешней пакет может быть использован, чтобы открыть эти файлы SPSS, которые так же легко:.

install.packages("foreign") 
library(foreign) 

setwd("/Path/to/your/files") 
read.spss("FILENAME.sav", to.data.frame=T) 
+0

Нет необходимости устанавливать этот пакет, поскольку это один из рекомендуемых пакетов, поставляемых с R. –

Смежные вопросы