2009-06-04 3 views
2

Несколько дней назад я увидел, что happn.in теперь предлагает услугу, в которой твиты (сообщения на twitter.com) сгруппированы и проанализированы для локальных областей. Для нескольких городов они дают вам список тенденций.Twitter: Локальные сообщения через API

Я знаю, что вы не можете точно знать, как они это делают, но, может быть, вы можете мне помочь: как я могу это сделать? У меня есть несколько подходов. Один из них полезен?

  • ПОДХОД 1

Используйте REST API public_timeline и пройти через все твиты каждый раз. Составьте список шаблонов и мест размещения, например. «Нью-Йорк» и «Нью-Йорк» отправляются в «Нью-Йорк Сити», «Лос-Анджелес» и «Лос-Анджелес» в «Лос-Анджелес» и т. Д. Если вы не можете найти известный шаблон, вы продолжите следующий твит.

  • ПОДХОД 2

Используйте функцию геокодирования Search API, например, "http://search.twitter.com/search.atom?geocode=##LAT##%2C##LONG##%2C##radius##km". К сожалению, я не знаю, являются ли результаты доверчивыми/хорошими !?

  • ПОДХОД 3

Follow пользователей, которые имеют название города в их поле местоположения и анализирующие REST API friends_timeline

У вас есть другие идеи?

Надеюсь, вы можете мне помочь. Заранее спасибо!

ответ

4

ПОДХОД 1 - Повторное обращение к публичной шкале времени не даст вам всех твитов, их слишком много. Вы получите 20 последних, а серверы Twitter будут кэшировать их на некоторое время, поэтому, даже если вы просто продолжаете забивать, вы получите те же результаты. У них есть канал XMPP, который будет выдавать вам обновления, но вы должны подать заявку на доступ.

ПОДХОД 2 & ПОДХОД 3 - В любом из этих случаев вы полагаетесь на пользователей, чтобы предоставлять правдивую информацию. Ничто не мешает пользователю отказаться от этого или лгать.

Независимо от вашего подхода, вы также должны следить за ограничениями API, если вы собираетесь повторно запрашивать. Подумайте о том, чтобы подать заявку на учетную запись с белым списком, которая даст вам 20 000 reqs/hour вместо 100, которые каждый получает по умолчанию.

Это говорит о том, что 2 & 3 даст вам лучшие результаты, чем 1. Получение доступа к ленте xhpp «firehose» и использованию местоположения или геокода, вероятно, даст вам наилучшие результаты. Вероятно, вы никогда не получите на 100% достоверную информацию, даже с этим, но это, вероятно, лучшее, что вы можете сделать.

Вы также можете посмотреть gnip.com. У них есть доступ к щебетать, и я считаю, что они могут каким-то образом их фильтровать и переупаковывать. Признаюсь, я не очень хорошо знаю об их служении, но это список моих дел. Возможно, вам придется заплатить за это.

1

happn.in на самом деле очень просто:

Они имеют разные пользователь для каждого города (т.е. happn_in_ny), которые следуют людям в этом городе, и они просто используют друг хронологию этого пользователя проанализировать.

+0

Спасибо, по-видимому, вы правы. Я просто видел все эти счета. Но это немного спам, чтобы сделать это таким образом. Некоторые из их учетных записей были приостановлены, например. happn_in_tor для Торонто. – caw

1

Вы можете сделать комбинацию первых двух:

http://search.twitter.com/search?q=near%3ANYC+within%3A15mi (как их пример говорит) & геокод = whatever_NY_geocode_may_be

+0

Спасибо, параметр «near» недоступен в API, поэтому я не могу его использовать, только «геокод». – caw

Смежные вопросы