2015-03-30 2 views
0

Я пытаюсь найти простой способ очистить данные твитера с помощью хэштега. Например, я хотел бы очистить все твиты, содержащие #testhash.Скрестить данные Twitter с помощью R

Я видел пару сообщений, особенно один (http://www.datablog.sytpp.net/2014/04/scraping-twitter-with-r-a-how-to/), но кажется, что пакет tweetR поврежден (не устанавливается на моем компьютере и делает R-краш). Любая идея была бы замечательной, но я особенно знаком с R, так что было бы еще лучше.

ответ

2

В апреле 2015 года код the blog post you mentioned больше не работает для меня (с twitteR v1.1.8).

И я не знаю, почему вам не удалось установить пакет twitteR. Попытайтесь установить зависимости самостоятельно, один за другим. Для каждого:

методы, bit64, rjson, DBI, HTTR, твиттер

пробег

install.packages("methods") 
#... 

Может быть, помогает узнать о проблеме.

Тогда я просто попытался это (быстрый и грязный раствор не разделяют ваши незашифрованные учетные данные с кем-либо.):

library(twitteR) 

#, please see https://apps.twitter.com/ 
consumerKey = "PH...." # from your app name 
consumerSecret = "zr...." 
accessToken = "5199999-22...." 
accessSecret = "94..." 
options(httr_oauth_cache=TRUE) # skip question appearing on console 
setup_twitter_oauth(consumer_key = consumerKey, consumer_secret = consumerSecret, 
        access_token = accessToken, access_secret = accessSecret) 

# tweets about beer 
searchTwitter("#beer", n=100) 
# tweets about Berlin 
searchTwitter("#berlin", n=100) 
# tweets about nerds 
searchTwitter("#nerds", n=100) 
# tweets about R 
#Rtweets(n=42) 
# ... 
########################################################################## 
## lets test out what our session limits look like now after these requests 
########################################################################## 
rate.limit <- getCurRateLimitInfo() 
# print out all metrics that have been changed 
rate.limit[rate.limit$limit != rate.limit$remaining,] 
Смежные вопросы