Я специально задаюсь вопросом, имеет ли MapR кластер Kmeans, как и Mahout?Имеет ли MapR масштабируемые машинные алгоритмы. Как Маху?
ответ
Насколько я знаю, MapR является только «более быстрым» Hadoop. Алгоритмов нет.
Таким образом, ваши рабочие места должны быть совместимы.
Но какова сделка в реализации собственной? K-средство ультра просто. Смотрите мой блог: http://codingwiththomas.blogspot.com/2011/05/k-means-clustering-with-mapreduce.html
Однако я реализовал к-средства кластеризации с BSP (Bulk Synchronous Parallel) и Apache Хама, который почти в десять раз быстрее, если сравнивать его с результатами тестов Mahout в этой книге: http://www.manning.com/ingersoll/ (сопряженный JIRA: https://issues.apache.org/jira/browse/MAHOUT-588) Вот эталоном к- средств с Apache Хама: http://wiki.apache.org/hama/Benchmarks
Вы можете найти здесь: https://github.com/thomasjungblut/thomasjungblut-common/blob/master/src/de/jungblut/clustering/KMeansBSP.java
- 1. Помогает ли Маху поддерживать слово?
- 2. Является ли MapR заменой MapReduce
- 3. mapr: установить mapr-zookeeper-5.0.0 вручную
- 4. mapr установка с скриптом mapr-setup
- 5. Машинные файлы заголовков
- 6. Как запустить Mapr?
- 7. Как создать масштабируемые приложения?
- 8. Почему машинные алгоритмы обучения, такие как xgboost, не могут использоваться в производственной среде?
- 9. Масштабируемые сети
- 10. Имеет ли Optaplanner версии 6.3 эволюционные алгоритмы или гиперэвристики?
- 11. Имеет ли MongoDB свои алгоритмы для повторного использования пустого пространства?
- 12. Нужно ли мне владеть Хадоопом, прежде чем учиться Маху?
- 13. Как использовать машинные переменные в cookiecutter
- 14. Как создать оверлейные масштабируемые divs
- 15. Масштабируемые темы в qooxdoo
- 16. Масштабируемые наложения карт Google
- 17. Интеграция Mapr Phoenix
- 18. LLVM не используя машинные инструкции
- 19. Как расшифровать машинные коды от x86 ASM?
- 20. Как сбросить машинные инструкции, используемые программой Perl
- 21. MapR Stream и PySpark
- 22. масштабируемые swfs и javascript
- 23. Масштабируемые сайты с jQuery
- 24. Масштабируемые маршруты экспресс-узлов
- 25. Подавать Масштабируемые изображения
- 26. Масштабируемые встроенный SVG
- 27. масштабируемые облачные вычисления услуг
- 28. Масштабируемые Популярные изображения - Wordpress
- 29. Масштабируемые генераторы в scalacheck
- 30. HBase mapr m7 python
Ууу! Я посмотрю на эти ссылки! Спасибо .... –
MapR - это не просто быстрый Hadoop. Он также включает в себя все стандартные компоненты экосистемы. Сюда входит Mahout. –
Вы, безусловно, правы, что реализация Hadoop с уменьшением карты не подходит для итеративных алгоритмов, таких как традиционные k-средства, используя алгоритм Ллойда. Существует открытый JIRA, который позволит проводить однопроходный анализ k-средних. Будучи однопроходным, этот алгоритм не требует многократных проходов через данные, а также не требует множественных вызовов сокращения карты для работы. Ускорения должны быть сопоставимы с тем, что описывает Томас. –