Имеется ли теоретический анализ, который описывает, какие проблемы может решить mapreduce?Какие проблемы могут решить mapreduce?
ответ
Для проблем, требующих обработки и создания больших наборов данных. Скажите, что запрос на получение процентов распространяется на все учетные записи банка. Скажем, обрабатывать данные аудита для всех транзакций, которые произошли в прошлом году в банке. Лучший вариант использования - это поисковый индекс Google для поисковой системы Google.
Все, что связано с выполнением операций над большим набором данных, где проблема может быть разбита на более мелкие независимые под-проблемы, результаты которых затем могут быть агрегированы для получения ответа на большую проблему.
Тривиальный пример будет вычислять сумму огромного набора чисел. Вы разбиваете множество на более мелкие множества, вычисляете суммы этих меньших множеств параллельно (что может включать разделение их на еще меньшие множества), а затем суммируйте эти результаты, чтобы достичь окончательного ответа.
Многие проблемы, которые являются «Смутно параллельными» (отличная фраза!), Могут использовать MapReduce. http://en.wikipedia.org/wiki/Embarrassingly_parallel
Из этой статьи .... http://www.businessweek.com/magazine/content/07_52/b4064048925836.htm ...
Doug Cutting, основатель Hadoop (реализация с открытым исходным кодом MapReduce) говорит ... «Facebook использует Hadoop для анализа поведения пользователей и эффективность объявлений на сайте «
и ...» техническая команда The New York Times арендовала вычислительную мощность на облаке Amazon и использовала Hadoop для конвертации 11 миллионов архивных статей, относящихся к 1851 году, в цифровую и поисковую документы. В один день они развернули работу, которая в противном случае имела бы ан месяцев.»
В Map-Reduce for Machine Learning on Multicore Чу и др описывают„алгоритмы, которые соответствуют модели статистического запроса может быть записана в определенном „виде суммы“, которая позволяет им быть легко распараллелить на многоядерных компьютерах.“Они специально реализовать 10 алгоритмов, включая, например, взвешенную линейную регрессию, k-средства, Naive Bayes и SVM, используя каркас сокращения.
Проект Apache Mahout выпустил недавнюю реализацию Hadoop (Java) некоторых методов, основанных на идеях из этой статьи.
Вы также можете посмотреть videos @ Google, я сам их наблюдаю, и я нахожу их очень образовательными.
Ответ лежит на самом деле во имя алгоритма. MapReduce - это не работа по параллельному программированию общего назначения или пакетная реализация, как предлагают некоторые из ответов. Уменьшение карты действительно полезно, когда больших наборов данных, которые необходимо обработать (этап сопоставления), и получить определенные атрибуты оттуда, а затем их следует обобщить на эти производные атрибуты (фаза сокращения).
Сортировать мирового введения Привет MapReduce
http://blog.diskodev.com/parallel-processing-using-the-map-reduce-prog
Этот вопрос был задан до его времени. С 2009 года фактически проведен теоретический анализ вычислений MapReduce. В этой статье 2010 года Howard Karloff et al. формализуется MapReduce как класс сложности так же, как теоретики изучают P и NP.Они доказывают некоторые отношения между MapReduce и классом NC (который можно рассматривать как параллельные компьютеры с разделяемой памятью или определенный класс ограниченных схем). Но основной частью работы являются их формальные определения.
- 1. Какие проблемы могут решить решения TensorFlow?
- 2. Какие проблемы могут ограничивать идентификаторы БД?
- 3. Проблемы с матрицей 8x5 не могут решить
- 4. @PreAuthorize не работает. Какие могут быть проблемы?
- 5. Какие проблемы могут возникнуть при двухфазных фиксациях?
- 6. Какие проблемы с перестройкой могут расплавиться/бросить не решить за один шаг?
- 7. Какие практические проблемы могут решить параллельные вычисления, f # и GPU-параллельная обработка?
- 8. Какие проблемы можно решить или решить легче, используя графики и деревья?
- 9. Какие проблемы ORM пытаются решить, что нет в базе данных?
- 10. Могут ли рекурсивные классы вызывать какие-либо проблемы
- 11. Какие проблемы могут вызвать идентификатор контейнера фрагмента фрагмента
- 12. Какие свойства изображения могут вызвать проблемы с размером?
- 13. Какие проблемы могут привести к отключению владельца файла nib?
- 14. Какие проблемы могут возникать при выполнении страницы JSP?
- 15. Какие могут быть некоторые проблемы при использовании OpenMP?
- 16. Какие проблемы безопасности могут возникнуть при представлении phpinfo() конечным пользователям?
- 17. Какие проблемы могут возникнуть у людей с TFS 2008?
- 18. Какие свойства CSS могут вызвать проблемы в Internet Explorer?
- 19. Какие могут быть проблемы с переходом с MSXML4 на MSXML6?
- 20. Какие проблемы могут возникнуть при ветвлении в управлении версиями?
- 21. Какие настройки браузера могут вызвать проблемы с кодировкой сервера?
- 22. Какие проблемы могут возникнуть при добавлении JComponents к компоненту
- 23. Какие проблемы могут возникнуть при открытии/закрытии LOT соединений MySQL?
- 24. Какие проблемы могут возникнуть при делении длинного длинного на int?
- 25. Какие проблемы могут возникнуть при использовании приложения MIME-типа/json?
- 26. Нужна помощь, чтобы решить эту MapReduce код
- 27. mysql: какие запросы могут дозировать, какие индексы?
- 28. Разрешение отрицания проблемы в mapreduce?
- 29. Как решить проблемы нехватки памяти
- 30. решить проблемы с копированием/вставкой?