Я устанавливаю один узел и многострочный (1 мастер и 1 подчиненный) кластер. Когда я пытаюсь запустить свое приложение, он принимает одинаковое время для одного узла и нескольких узлов. В моем приложении я копирую данные из HDFS в локальную файловую систему, а затем выполняю обработку на ней. Это потому, что у меня есть файлы, хранящиеся локально, и файлы недоступны для других узлов в кластере? Я предоставляю файл, который фактически разделен на 3 куска, поэтому логически его следует обрабатывать быстрее на нескольких узлах. Любая идея?Hadoop Single-node vs Multi-node
Спасибо!