2012-11-10 2 views
0

Reddit API содержит информацию о счете любого поста, включая количество оборотов, количество downvotes и общий балл. Я хочу использовать эту информацию, чтобы сделать некоторый анализ названий сюжетов и, в конечном итоге, контент, к которому привязаны сюжетные ссылки (самостоятельная публикация, статья в блоге, что угодно), чтобы попытаться предсказать, какие сообщения будут хитом, и что будет ошибкой.Нахождение сообщений с низким рейтингом на Reddit

API Reddit обеспечивает легкий доступ к самым высоким забитым сообщениям из любого данного субредадата (включая r/all), но нет простого способа найти сообщения с низкой оценкой, особенно учитывая, что существуют различные типы низких баллы.

Например, у вас может быть история, которая является новой и имеет 0 взлетов, 0 падений и 0 баллов. Это история на флопе? Не обязательно. Это просто ново. Однако из-за того, как работает Reddit, история может иметь 0 взлетов, 50 проходов и 0 очков. Скорее всего, этот пост был ненавистным, спамом или чем-то иным, что предназначалось для троллинга. Я думаю, мне нужно провести различие между этими двумя типами историй, чтобы получить более точное представление.

Я хочу, чтобы лучшие 10% и самые низкие 10% баллов оценивались мудрыми, поэтому, если вы знаете способ найти общее количество историй, представленных субреддиту, я бы хотел услышать об этом!

Каков наилучший способ поиска историй, имеющих низкие баллы? Должен ли я начать с первой страницы и использовать алгоритм грубой силы, проверяя взлеты, падения и оценку каждой истории, пока я не получаю достаточное количество данных? Какие другие переменные мне нужно учитывать?

ответ

0

Каков наилучший способ поиска историй, имеющих низкие баллы?

search functionality из Reddit, скорее всего, это ваш лучший выбор, чтобы найти низкие скоринговые подписки subreddit, или наборы subreddits. К сожалению, похоже, что ни индекс, ни количество голосов (вверх или вниз) не включены в индекс. Возможно, если вы зададите эти вопросы по телефону /r/redditdev, вы получите положительный ответ от /u/kemitche.

Должен ли я начинать с первой страницы и использовать алгоритм грубой силы, проверяя взлеты, падения и оценку каждой истории, пока я не получаю достаточное количество данных?

Вы также можете связаться с /u/Deimorz, как Deimorz уже сделал это [1, 2] и могут быть в состоянии предоставить вам ответы на ваши вопросы.

Я хочу, чтобы топ-10%, а самый низкий 10% историй забить мудр, так что если вы знаете способ, чтобы найти общее количество историй, представленных на subreddit, я хотел бы услышать об этом!

К сожалению, без того, контролировать все материалы, представленные на subreddit в течение долгого времени, или задним числом пытается ползать представлений Reddit (как Deimorz сделал) единственным возможным способом, чтобы спросить админов Reddit непосредственно.

+0

Я рассмотрел использование функции поиска, но если оценка не включена, то как мне отфильтровать рассказы с более высокими баллами? Я обязательно спрошу у r/redditdev и посмотрю, что они скажут. Совет по связи с Деймозом, вероятно, окупится. Я до сих пор не знал о его работе, поэтому спасибо! –

+1

Я просто предложил спросить/u/kemitche, потому что он знал бы, как получить доступ к этой информации, если это произойдет. Кроме того, он был бы человеком, предлагающим добавить информацию о голосовании как функцию поиска, если она еще не включена. – bboe

Смежные вопросы