У меня есть файлы, которые автоматически генерируются, и я не могу изменить формат. Я хотел бы иметь возможность хранить данные в соответствующем формате R. Они идут так:R хранить несколько векторов из неотформатированных текстовых файлов
File: /path/to/file
Start Date: 07/05/16
Subject: 0
Start Time: 10:01:09
Name: FooBar
K: 0.000
O: 0.000
A:
0: 91.600 65.000 238.000 31.000 24.000
5: 7.000 22162.000 78.000 10.000 20000.000
10: 55.000 0.000 2.000 6.000 53.000
B:
0: 0.000 2.000 1.000 1.000 1.000
5: 1.000 1.000 1.000 1.000 1.000
[...] # Goes all the way to Z
Start Date: 07/05/16
Subject: 8
Start Time: 10:11:09
Name: JohnDoe
K: 0.000
O: 0.000
A:
0: 91.600 65.000 238.000 31.000 24.000
[...] # Goes all the way to Z
Я открыл файл, используя readLines
, поэтому линия каждый длинный характер. Каждый файл содержит несколько сеансов, которые идентифицируются по дате, имени, теме и времени. Каждый сеанс содержит несколько числовых переменных, которые представляют алфавит (LETTERS
). Например, в первой сессии (FooBar), K может быть представлена в виде c(0.000)
и B, как
c(0.000,2.000,1.000,1.000,1.000,1.000,1.000,1.000,1.000,1.000)
Первые строки (Файл, дата начала, время начала, название) являются информацией о сессиях, которые я был в состоянии сохранить в этом dataframe:
#Sessions data.frame
structure(list(`Start Date` = c("07/05/16", "07/05/16"), Subject = c("0", "8"), `Start Time` = c("10:01:09",
"10:11:09"), Name = c("FooBar",
"JohnDoe"
)), .Names = c("Start Date", "Subject", "Start Time", "name"), row.names = 1:2, class = "data.frame")
это две вещи, которые я борюсь с
- Как сохранить переменные (AZ) в качестве числовых векторов?
- Как я могу структурировать эти числовые векторы, чтобы их было легко получить для каждой сессии?
я имел в виду сочетание apply
, startsWith
и scan
, но я не могу понять, что лучший способ структурировать мои данные.
вы были бы открыты для решения не с помощью R? Я думаю, awk может неплохо обработать файл и вывести что-то более пригодное для R. – Tensibai
@ Tensibai К сожалению, мы можем использовать только R-решение в нашей среде. Тем не менее, я могу работать с любым пакетом R, если это необходимо. – Wistar
Тогда удачи, было бы довольно легко превратить это в csv с awk, не так просто в R. (Мне было бы любопытно, почему awk не может быть использован, который сказал, даже назвав его из R 'system2' в худшем случае) – Tensibai