Я начинаю писать карты, и я не уверен в некоторых свойствах функции уменьшения.Уменьшить свойства, которые я не уверен в
Таким образом, уменьшить получает (ключ, список значений) в качестве входного параметра ...
- является гарантировал, что список входных значений всегда содержит по крайней мере 2 членов? Итак, уникальный ключ, испускаемый преобразователем, никогда не будет передан редуктору?
- или, если в списке входных данных имеется только один элемент, гарантировано ли, что ключ уникален?
- может уменьшить излучение больше значений, чем размер списка входных значений?
- У меня есть большой список строк. Мне нужно найти все из них, которые не уникальны. Могу ли я сделать это с помощью только одной карты/уменьшить? Единственный способ, которым я вижу, чтобы сосчитать все уникальные строки на одной карте/уменьшение, а затем выбрать те из них, которые не являются уникальными по другой карте/уменьшить
Благодарности
Есть некоторые из основных вопросов Q вокруг MR - взгляните на [Обработку данных с интенсивным текстом с помощью MapReduce] (http://lintool.github.io/MapReduceAlgorithms/) для быстрого введения и различных алгоритмов в МИСТЕР. –