Число отображаемых карт() равно числу 64 МБ блоков входных данных. Предположим, что у нас есть 2 входных файла размером 1 МБ, оба файла будут храниться в одном блоке. Но когда я запускаю свою программу MR с помощью 1 namenode и 2 jobnodes, я вижу 2 map(), порожденный, по одному для каждого файла. Так это потому, что система пыталась разделить работу между 2 узлами т.е.Различается ли число задач карты, зависит от количества рабочих мест?
Number of map() spawned = number of 64MB blocks of input data * number of jobnodes ?
Кроме того, в MapReduce учебнике, его написано, чем для 10TB файла с блочным существом 128KB, 82000 карт будут порождало. Однако, согласно логике, что количество карт зависит только от размера блока, должно быть создано 78125 заданий (10 ТБ/128 МБ). Я не понимаю, как было создано несколько дополнительных рабочих мест? Будет здорово, если кто-нибудь может поделиться своими мыслями по этому поводу? Благодарю. :)