2010-04-16 3 views
4

Я создаю базу данных + инструмент, который отслеживает новостные ленты на определенный срок. Например, «пищевое отравление от орехов». Я хочу подрезать сайты социальных сетей, новостные сайты, крупные агрегаторы новостей и т. Д. ... на этот раз.API новостей для общих новостей

  • Вопрос 1: Каковы некоторые из новостных сообщенийAPI-интерфейсы агрегатора?
  • Вопрос 2: Как бы вы пошли по кодированию и получали только последние новости от API?

Редактировать Добавлена ​​схематичное: alt text http://koopics.com/news_parser.jpg

ответ

4

Знаете ли вы, что Yahoo! Pipes? Это очень гибкий агрегатор подачи, и вы можете манипулировать им с помощью YQL, который довольно мощный и имеет Python librabry, python-yql :). У YQL также есть специальные «таблицы» для Twitter и других сервисов и источников новостей, поэтому, в зависимости от того, что вы хотите, вам может даже не понадобиться Pipes.

Существует быстрый пример использования Pipes + YQL на http://blog.ouseful.info/2009/04/27/using-yql-with-yahoo-pipes/, но вы можете поиграть с ними на YQL Console.

Итак, это ваш «вопрос 1». Но, используя YQL, «Вопрос 2» (если я его правильно понял) приходит естественным образом, поскольку вы используете его почти как обычный SQL, налагая ограничения, заказы и т. Д.

+0

+1 Я искал что-то вроде этого :) Вот интересный [слайд] (http://www.slideshare.net/ConSanFrancisco123/yahoo-pipes-middleware-in-the-cloud) – CoderHawk

+0

@ Sandy: nice, good reference :) – rbp

0

Если вы получили денежную поддержку резервного проекта , У Reuters есть каналы новостей, которые вы можете подписаться ежемесячно.

1

Вы пробовали Universtal Feed Parser ??

+0

Быстрый взгляд на сайт говорит, что они не обновлялись с 2007 года – dassouki

+0

Но это не делает то, что вы хотите? –

Смежные вопросы