Я пытаюсь добавить кучу зависимостей, хранящихся в hdfs, в распределенный кеш. Я следую советам этой статьи: http://www.datasalt.com/2011/05/handling-dependencies-and-configuration-in-java-hadoop-projects-efficiently/. Мой вопрос: возможно ли добавить папку, содержащую зависимости, к пути к классам?Добавление каталога файлов в Hadoop с использованием распределенного кеша?
DistributedCache.addFileToClassPath(new Path("/tmp/lib/"), job.getConfiguration());
Или мне нужно будет добавить каждую зависимость отдельно?
for (Path dependency : dependencies) {
DistributedCache.addFileToClassPath(dependency, job.getConfiguration());
}
И как я могу проверить, действительно ли зависимости были добавлены в путь к классам на всех подчиненных узлах?
Спасибо.