2016-09-19 5 views
1

У меня есть текстовый файл (myfile.txt), который выглядит следующим образом,Импорт и обработки текстового файла

Тема: 5581 2005 471 791 80 15184 64 2155 5581 2005 80 21292 10607 47 64 209 22910 132 84 3865 одна тысяча шестьсот семьдесят два 84 1570 84 2005 84 10492 1847 12330 4797 82 13886 2170 47

то, что я хочу, это вектор а, что это элементы будет следующим

а [1] = 5581 а [2] = 2005 а [ 3] = 471791 ..... и т. Д.

Я пробовал read.table() и readLines(), которые не помогли. Любая помощь будет оценена.

ответ

0

Мы можем использовать scan прочитать файл, чтобы создать vector класса numeric

A <- scan("myfile.txt", what = numeric(), quiet=TRUE) 

Если есть также Subject: префиксом в начале, мы читаем файл с readLines, удалить префикс часть с sub, и читать его с scan

lines <- readLines("myfile.txt") 
A <- scan(text= paste(sub("^\\S+\\s+", "", lines), collapse=" "), 
         what = numeric(), quiet=TRUE) 

Что касается регулярных выражений (^\\S+\\s+), мы в соответствии с одной или больше символов без пробела (\\S+) с начала (^) строки, за которой следуют один или несколько символов пробела (\\s+), и замените его пробелами ("") в sub.

Смежные вопросы