2014-01-03 7 views
0

Я использую свой скрипт python и Tweepy для сбора твитов и извлечения только части текста. Я сохранил все тексты из этих твитов в формате txt.Как преобразовать файл Txt в формат .Rdata

Я сейчас пытаюсь загрузить этот текст в R для анализа текста с помощью этого модуля (http://rpubs.com/gogamza/ko_text_mining) Тем не менее, этот модуль R принимает только .rdata файлы, и я как-то нужно кормить мою коллекцию твит на R.

код R говорит:

library(twitteR) 
# n <- 200 
# 
# keyword <- '삼성전자' 
# 
# keyword <- enc2utf8(keyword) 
# 
# rdmTweets <- searchTwitter(keyword, n) 

load(url("http://dl.dropbox.com/u/8686172/twitter.RData")) 

nDocs <- length(rdmTweets) 

Таким образом, внутри команды загрузки, я хотел бы добавить свой собственный текстовый файл там.
Может ли кто-нибудь предложить мне подсказку? Большое спасибо. Я бы очень признателен.

+0

Просто переименовывает его в работу или является .Rdata более сложным, чем это? – PyRulez

+0

'.Rdata' более сложный. Вы пытались использовать 'read.table'? –

+0

Я попытался переименовать его, но это не сработает. Я думаю, что структура плоская вне. – BBK

ответ

0

Вы можете загрузить данные в вашем текстовом файле в R и сохранить его как файл RDATA:

sapply(list.files("/folderWithFiles", pattern="*.txt", full.names = TRUE), 
     function(x) { myDataInVector = scan(x, what=character()); save(myDataInVector, file=gsub("\\.txt","\\.RData",x)) }) 

Чтение частично scan(x, what=character()) предполагает наличие данных во всех в текстовом файле в виде пространства с разделителями вектор. Вы можете использовать read.table или изменить аргументы команды сканирования, если она находится в другом формате.

Смежные вопросы