Если у меня есть, скажем, миллион записей по Mongo DB и каждая запись размером 5 КБ. Скажем, я хочу запустить Map-Reduce по этим данным и хочу оценить оперативную память, необходимую для этого приложения. Во время операции уменьшения карты не будет читаться или записываться в эту БД. Map-reduce собирает агрегирование некоторых записей и делает логические сравнения агрегированных записей.Какова процедура расчета рабочего набора?
Я хотел бы понять, как map-reduce приведет данные в ОЗУ и, следовательно, как должен вычисляться рабочий набор (например: следует ли считать, что 1 MM x 5 Кб будет моим рабочим набором).