Кажется, что DistributedCache пригодится, когда вам нужно поместить небольшой объем данных, который будет часто использоваться вашим картографом/редуктором для DistributedCache. Но в некоторых случаях данные, которые вы хотите поместить в ваш картограф, будут довольно большими, скажем, более 300 МБ. Что бы вы сделали в таких случаях? Какова была бы альтернатива распределенному кэшу в таком сценарии?Какова альтернатива DistributedCache в программе MapReduce?
ответ
Распределенный кеш по умолчанию составляет несколько гигабайт, поэтому 300 МБ не обязательно является проблемой. (Вы можете отрегулировать размер в
mapred-site.xml
.) Получение 300 МБ к узлу все равно может оказаться полезным, если ваша работа выполняется часто, и в кэше мало другого оттока.Другой вариант - разместить ваши файлы на HDFS и прочитать задания оттуда. Для этого вы можете использовать API-интерфейсы
org.apache.hadoop.fs.FileSystem
.
Чтобы выбрать, какой из них лучше, вероятно, вы должны попробовать оба способа и увидеть, что дает лучшую ввода/вывода и номера во время выполнения (включая воздействие на другие рабочие места). Это может зависеть от того, насколько часто выполняется ваша работа, сколько других вещей в кеше, соотношение карты/уменьшения и т. Д.
- 1. Чтение HAR-файла из DistributedCache в mapreduce
- 2. DistributedCache в Hadoop MapReduce-Null pointer Exeception
- 3. java.lang.ArrayIndexOutOfBoundsException в программе Hadoop mapreduce
- 4. Альтернатива Женевской рамочной программе
- 5. Какова альтернатива Response.Redirect() asp.net?
- 6. Html.fromHtml() устарел, какова альтернатива?
- 7. Какова альтернатива $ _SERVER ['PHP_SELF']?
- 8. Какова ваша альтернатива аннотациям?
- 9. Какова альтернатива структурам perl?
- 10. Какова альтернатива toObservable?
- 11. Какова альтернатива angular.isString() в угловом2?
- 12. Какова альтернатива IValueFormatter в AutoMapper?
- 13. Какова альтернатива флажкам в android?
- 14. Какова альтернатива автобоксированию в Java?
- 15. Неожиданный выход в программе Mapreduce в Hadoop
- 16. Какова функция `[1]` в программе?
- 17. Hadoop DistributedCache
- 18. Исключения нулевого указателя в Hadoop MapReduce программе
- 19. Использование core-site.xml в программе mapreduce
- 20. Функция mapper всегда необходима в программе mapreduce?
- 21. NullPointerException в программе MapReduce для сортировки
- 22. Обязателен ли входной файл в программе MapReduce?
- 23. Предотвращение разбиения входных данных в программе MapReduce
- 24. редуктор не вызывается в программе mapreduce
- 25. Java ArrayIndexOutOfBound Exception в программе MapReduce
- 26. Запуск класса mapreduce в другой Java-программе
- 27. Какова альтернатива датчику ориентации Android?
- 28. Какова может быть альтернатива strlen()?
- 29. Какова альтернатива поставщикам данных OleDB?
- 30. Какова альтернатива блоку нестатической инициализации?
Благодарим вас за комментарий. Очень проницательный! – Clark
Присоединение на стороне карты и соединение сбоку могут быть альтернативным вариантом, если размер файла больше, чем у GB, я думаю. Прокомментируйте, пожалуйста. – Ravikanth