2013-04-02 2 views
4

Что такое сайты для Hadoop Лучшая практика, а не книги, где я могу получить пошаговый процесс для создания новых проектов и небольших примеров. Я не могу найти ни одного сайта, как это, пожалуйста, поделитесь.Что такое сайты для Hadoop? Лучшие практики

+0

Необходимая VM, cluste все хорошо настроено на моей машине, мне просто нужен исходный код с Java. Например, такие сайты, как «http://www.kodejava.org/» для java, где они написали весь исходный код. Таким образом, вот такой сайт, который содержит примеры. Я могу искать код, но я не могу найти идеальный –

+0

возможный дубликат [Что является лучшим сайтом для Hadoop Practical, Like codding stuff] (http://stackoverflow.com/questions/19422096/what-is -the-best-site-for-hadoop-practice-like-codding-stuff) – doge

ответ

1

Существует огромная статья от разработчиков Yahoo на Apache Hadoop: Best Practices and Anti-Patterns

+0

Требуемая VM, cluste все хорошо настроено на моей машине, мне просто нужен исходный код с Java. Например, такие сайты, как «kodejava.org/»; для java, где они написали весь исходный код. Таким образом, вот такой сайт, который содержит примеры. Я могу искать код, но я не могу найти идеальный –

0

Hadoop не что-то одно приложение вместо этого является распределенная структура обработки, которая используется несколькими приложениями, который сидит сверху этой структуры. Pig, Hive, HBase, Cassandra и т. Д. Являются немногими из многих таких приложений, разработанных для конкретных требований. Под всеми этими приложениями используется инфраструктура Hadoop, которая в основном состоит из распределенной файловой системы (HDFS) и распределенной обработки (MapReduce).

Технически, если у вас есть минимальный кластер Hadoop (только HDFS + MapReduce), вы можете начать писать приложения на основе MapReduce (на Java или другие языки поддерживаются через Hadoop Streaming) для обработки некоторых данных.

Что вы можете сделать, это сначала загрузить предварительно построенный/сконфигурированный виртуальный образ Hadoop из дистрибутива Cloudera или Hortonworks и запустить его на вашем компьютере. После этого начните изучение написания заданий MapReduce в Java и запустите на своей виртуальной машине.

Вот URL в download Cloudera Hadoop Distribution VM

Вот link научиться писать простейшую WordCount работу.

+0

Требуемый VM, cluste все хорошо настроено на моей машине, мне просто нужен исходный код с Java. Например, такие сайты, как «kodejava.org/»; для java, где они написали весь исходный код. Таким образом, вот такой сайт, который содержит примеры. Я могу выполнить поиск кода, но я не смог найти идеальный вариант, пожалуйста, помогите –

+0

Проверьте это для MapReduce: http://jsoftbiz.wordpress.com/2012/11/21/confused-about-mapreduce/ – AvkashChauhan

+0

Да это сайт, есть ли какой-либо другой сайт, где я могу найти java hadoop codding –

Смежные вопросы