2010-03-02 5 views
9

Я узнал Hadoop несколько месяцев назад и сумел сделать очень вводный проект программирования на нем. Я хочу сделать небольшой проект среднего размера или серию небольших заданий программирования с Hadoop. Я видел много идей, но я не вижу ничего, что может быть завершено за 60-70 часов работы, поэтому довольно мелкий проект, который я хочу сделать в свободное время вместе с другими исследованиями. Большинство проектных идей, которые я видел, вроде бы продолжались в течение 2-3 месяцев. Моя главная цель этого упражнения - создать хороший опыт программирования с использованием среды Hadoop, чтобы не делать никаких исследований или решать конкретные проблемы. Я вижу, что Hadoop используется много с веб-сервисами, возможно, это будет интересный трек для небольших проектов.Идея проекта с Hadoop MapReduce

Заранее спасибо.

С уважением, Адитья

ответ

1

Недавно я наткнулся на Cloud9 MapReduce library разработанной UMD. Судя по предыдущему вопросу о НЛП, я подумал, что это может вам пригодиться.

В нижней части страницы есть несколько упражнений, которые могут предоставить вам место для начала.

Для некоторой информации по обработке текста с помощью MapReduce вы могли бы взглянуть на этот проект книги связан с автором Джимми Лин:

Data-Intensive Text Processing with MapReduce

+0

Эта «библиотека Cloud9 MapReduce» ссылка не работает. Если возможно, измените ссылку. – Azim