2012-03-27 2 views
0

Привет, я новичок в R, и я строил два руководства из Интернета, я выяснил, как автоматизировать скрипт для интеллектуального анализа данных, но вместо добавления данных затем записывается каждый раз, когда код запускается. Я хотел бы, чтобы это было добавлено, может кто-нибудь указать мне в правильном направлении.простой проект R

здесь сценарий как таковой

# loading the package is required once each session 
require(XML) 

# initialize a storage variable for Twitter tweets 
mydata.vectors <- character(0) 

# paginate to get more tweets 
for (page in c(1:15)) 
{ 
    # search parameter 
    twitter_q <- URLencode('#google OR #apple') 
    # construct a URL 
    twitter_url = paste('http://search.twitter.com/search.atom?q=',twitter_q,'&rpp=100&page=', page, sep='') 
    # fetch remote URL and parse 
    mydata.xml <- xmlParseDoc(twitter_url, asText=F) 
    # extract the titles 
    mydata.vector <- xpathSApply(mydata.xml, '//s:entry/s:title', xmlValue, namespaces =c('s'='http://www.w3.org/2005/Atom')) 
    # aggregate new tweets with previous tweets 
    mydata.vectors <- c(mydata.vector, mydata.vectors) 
} 

# how many tweets did we get? 
length(mydata.vectors) 
+0

Какой бит точно «написан поверх»? Кажется, из вашего кода, что 'mydata.vectors' будет содержать все результаты, которые у вас есть до сих пор. –

ответ

2

Я думаю, что вы хотите, чтобы сохранить результаты на диск между пробегами. Так, что-то вроде этого в самом начале:

if (!file.exists('path/to/file')) 
    mydata.vectors <- character(0) 
else 
    load('path/to/file') 

И что-то вроде этого в конце:

save(mydata.vectors, file='path/to/file') 

Если сделать трюк. Конечно, вы могли бы получить более сложные с сохранением типов файлов и т. Д.

+0

спасибо, теперь я задумываюсь, как добавить временную метку для каждой записи, а затем для предотвращения копирования одних и тех же твитов дважды =) – pyCthon

Смежные вопросы