Создание нескольких выходных файлов одинакового размера в Hadoop

Каковы методы поиска диапазонов данных X в Hadoop, чтобы можно было использовать эти диапазоны в качестве разделов на этапе редуктора?Создание нескольких выходных файлов одинакового размера в Hadoop

2013-06-19 syker

Похоже, вам нужно что-то вроде TotalOrderPartitioner, что позволяет получить полный порядок, считывая точки разделения из источника, генерируемого извне. Вы можете найти эту ссылку полезной: http://chasebradford.wordpress.com/2010/12/12/reusable-total-order-sorting-in-hadoop/.

Не знаете, действительно ли это именно то, что вам нужно? Извиняюсь, если я ошибаюсь.

2013-06-19 19:49:47 Tariq

ответ