Я пытаюсь использовать пакет twitteR, чтобы очистить серию открытых профилей Twitter, а затем собрать эти твиты в базу данных. Проблема, с которой я сталкиваюсь, заключается в том, что API, похоже, не собирает всю совокупность доступных твитов.пакет twitteR пропускает твиты?
Вот мой код:
library(RColorBrewer)
library(NLP)
library(twitteR)
library(foreign)
library(wordcloud)
library(tm)
library(base64enc)
library(httr)
access_token<-"" #not including these, but the oauth works for me
access_secret<-""
consumer_key<-""
consumer_secret<-""
###Scrapes Twitter Account
setup_twitter_oauth(consumer_key, consumer_secret, access_token, access_secret)
set.seed(123)
user.tweets<-userTimeline('@HillaryClinton', n=3200)
df<-twListToDF(user.tweets)
Этот код хватает 340 твитов со страницы твиттер Хиллари Клинтон. Но у нее более 8000 твитов, поэтому я смущен, почему это только хватало их. Я проверил дату для раннего твита, и это 27 апреля этого года. Является ли это проблемой API только для сбора обратно на эту дату?
Я не думаю, что это, потому что я также использовал этот код в профиле twitter друга. Это собрало всего 106 из его 451 твитов, но до конца этого достигло конца. Но в этом случае он пропускал некоторые твиты, которые он создал (они не были ретвитами).
Я что-то пропустил в своем коде, есть ли ограничение на функцию userTimeline, которую я пропускаю, или что?
Спасибо.
Это будет просто повторять одни и те же ответы снова и снова (пока Хиллари не встретятся в твиттере, а затем она возьмет новый твит и потеряет самые старые твиты). Вам нужно будет работать с параметром Max ID и параметрами After_id. Щебетать Предоставляет хорошую документацию относительно этого здесь: https://dev.twitter.com/rest/public/timelines –