Я новичок в hadoop и mapreduce.I есть проблема с запуском моих данных в hadoop Mapreduce. Я хочу, чтобы результаты были заданы в миллисекундах. Есть ли способ, которым я могу выполнять задания Mapreduce в миллисекундах? Если нет, то каково минимальное время, в течение которого mapbeduce может принимать полностью распределенный многокластер (5-6 узлов). Размер файла для анализа в hasoop mapreduce составляет около 50-100Mb Программа написана на Pig.Any suggestesstions?Время, проведенное MapReduce jobs
ответ
не возможно (afaik). hadoop не предназначен для вещей в реальном времени на первом месте. он лучше всего подходит для пакетных заданий. структура mapreduce требует некоторого времени, чтобы принять и настроить работу, которой вы не можете избежать. и я не думаю, что это мудрое решение получить ультравысокие машины для настройки кластера хауопов. Кроме того, структура должна сделать несколько вещей, прежде чем начать работу, например, создавая логические расщепления ваших данных.
спасибо за ваши предложения. –
Для использования в режиме реального времени запросов на использование данных Imapala, Apache Drill (WIP). Сверло основано на Google Dremel.
Рабочие места в ульях преобразуются в MapReduce, поэтому Hive также ориентирован на партию в природе, а не в реальном времени. Проделана большая работа по повышению производительности Hive (1 и 2).
- 1. log4j for hbase mapreduce jobs
- 2. Oozie for mutliple mapreduce jobs
- 3. chaining mapreduce jobs in hadoop
- 4. Время, проведенное на странице?
- 5. Отключение данных для Hadoop MapReduce jobs
- 6. MapReduce jobs застрял в состоянии Принято
- 7. повторное использование JVM в Hadoop mapreduce jobs
- 8. расписание AppEngine mapreduce jobs from вычислительный движок
- 9. Как отлаживать hasoop mapreduce jobs from eclipse?
- 10. Как запустить appengine mapreduce jobs в модуле?
- 11. Время, проведенное в режиме ядра
- 12. Время, проведенное на странице страницы
- 13. Рассчитать время, проведенное в javascript
- 14. Измерение «% Время, проведенное в GC»
- 15. Время, проведенное с помощью обзоров пэра?
- 16. Слишком долгое время, проведенное функцией Mysql
- 17. Как автоматически рассчитывать время, проведенное в JIRA?
- 18. Как записать время, проведенное методами в Springframework?
- 19. Как измерить время, проведенное на странице?
- 20. Rails показывает неправильное время, проведенное в запросе
- 21. Время, проведенное пользователем на веб-странице
- 22. Как измерить общее время, проведенное в функции?
- 23. Как отслеживать время, проведенное на сайте
- 24. Как объединить несколько Hadoop MapReduce Jobs в один?
- 25. Как получить статус Mapreduce jobs через REST API?
- 26. Отсутствует шаблон во время работы Cron Jobs
- 27. Диск разлив во время MapReduce
- 28. Как оценить время MapReduce работы
- 29. Время выполнения MapReduce с комбайнером
- 30. Время, проведенное в Object. <init> (hprof)
получить действительно действительно быстрый компьютер. –
спасибо за ваши предложения. –