В настоящее время я использую структуру MAP-REDUCE YARN. И использование hadoop в псевдораспределенном режиме. Я хочу использовать функцию «Распределенный кеш» здесь, чтобы добавить некоторые файлы в кеш и использовать их в моей функции карты. Как я могу это достичь.Функция распределенного кэша в YARN
1
A
ответ
1
Как добавить файлы в распределенной кэш:
- Использование опции Hadoop
.
hadoop jar <application jar> <main class> <input> <output> -files <absolute path to distributed cache file>
- с использованием распределенного кэша API:
.
job.addCacheFile(uri);
Hadoop -файлы вариант или распределенный кэш API копируют файлы кэша для всех узлов задачи и сделать его доступным для картографа/редуктора во время выполнения.
Как получить доступ к распределенной кэш:
Override метод установки в Mapper/редукторе и вызвать getCacheFiles из контекста. Пример кода ниже:
@Override
protected void setup(Context context)
throws IOException, InterruptedException {
Path[] localPaths = context.getCacheFiles();
if (localPaths.length == 0) {
throw new FileNotFoundException("Distributed cache file not found.");
}
File localFile = new File(localPaths[0].toString());
// code to process cache file
}
метод context.getCacheFiles возвращает массив URI файлов, установленных в конфигурации.
Смежные вопросы
- 1. Концепция распределенного кэша в Hadoop
- 2. Эквивалент распределенного кэша в искры?
- 3. Использование распределенного кэша - HIVE STREAMING
- 4. Hadoop 1.0.4 Ошибка распределенного кэша
- 5. Глядя на решения распределенного кэша для реализации распределенного шаблона MVC
- 6. Доступ распределенного кэша в Pig StoreFunc
- 7. Использование динамического распределенного кэша в Hadoop
- 8. Лазерный локальный кэш против распределенного кэша
- 9. распределенного кэша с WSO2 Cep двигателя
- 10. идеи для прокси-сервера распределенного кэша
- 11. Azure распределенного кэша sessionstate истекает непосредственно
- 12. Ошибка с ehcacheMulticastGroupAddress Настройка распределенного кэша Grails
- 13. Проблемы с использованием распределенного кэша Hadoop
- 14. Функция кэша в FieldcacheImpl
- 15. Использование Memcache для централизации распределенного кэша в базе данных
- 16. Объединить небольшие файлы в большие файлы для распределенного кэша Hadoop?
- 17. не в состоянии загрузить библиотеку из распределенного кэша Hadoop
- 18. Консистенция данных для NoSQL + распределенного кэша в очень параллельной среде
- 19. Синхронизация вычислений и результатов с использованием распределенного кэша JVM
- 20. низкой латентностью распределенного кэша для Java и C++ Object
- 21. Использование распределенного кэша и FileReader для кластера с одним узлом
- 22. Почему Microsoft избавилась от распределенного кэша Velocity как автономного продукта?
- 23. Использование распределенного кэша с возможностью обрабатывать Cache Miss
- 24. Лучший способ получить небольшой файл поиска с использованием распределенного кэша
- 25. Настройка нового распределенного кэша для лазурных веб-сайтов Предварительный просмотр
- 26. Конфигурация распределенного кэширования AppFabric
- 27. Рамка распределенного кэширования
- 28. Функция jquery .load, сбой кэша в IE
- 29. YARN: running yarn-env.sh дает ошибку
- 30. Когерентность распределенного кеширования за Namedcache
Он бросает «filenotfound execption». Пожалуйста, помогите мне с этим. –
Пожалуйста, посмотрите пример реализации распределенного кэша: https://github.com/tomwhite/hadoop-book/blob/master/ch08/src/main/java/MaxTemperatureByStationNameUsingDistributedCacheFileApi.java –
@VijayInnamuri Это мертвая ссылка. Можете ли вы разместить новый? – AST