Я использую 4 основных узла.Amazon EMR не использует все узлы
Я использую куст для запуска запросов на столе.
Различные запросы, похоже, используются при использовании емкости.
Моя таблица состоит из 8 целых полей и около 1000 строк.
запросы вида
выберите ср (col1-col2) от TBL; select count (*) from tbl; и любой другой запрос, я попытался производят
количество восстановителей = 1, количество мапперов = 1
я попытался с помощью заданных mapred.reduce.tasks = 4;
но он не работает.
Самое странное, что когда я использую mapred.job.tracker = local, это означает, что одна карта и одна сводятся к самому локальному узлу, задача завершается в два раза быстрее.
Все слоты для уменьшения/отображения, за исключением одного, открыты все время.
Почему не добавляется емкость, даже немного улучшая время исполнения? Является ли мой образец данных настолько малым, что увеличение емкости не имеет значения, а локализация отображения и сокращение фактически улучшает время?
Я не вошел в S3. Как проверить правильность работы tasktracjer или нет? – Sr1n4th