2016-11-25 4 views
5

Привет, Существует тема о написании текстовых данных на несколько выходных каталогов в один искровой работу с помощью MultipleTextOutputFormatКак написать Avro многократным выходной каталог с помощью искрового

Write to multiple outputs by key Spark - one Spark job

Я хотел бы спросить, есть ли какой-нибудь аналогичный способ записи Avro данных в нескольких каталогах

То, что я хочу, чтобы записать данные в файл Avro в другой каталог (на основе поля метки времени, в тот же день в метку времени идет в том же каталоге)

ответ

2

Класс AvroMultipleOutputs упрощает запись данных Avro на несколько выходов.

  • Корпус один: запись на дополнительные выходы, отличные от выходных данных по умолчанию. Каждый дополнительный вывод или именованный вывод может быть сконфигурирован с помощью собственных схемных и выходных форматов.

  • Дело два: записать данные в разных файлах, предоставленных пользователем

AvroMultipleOutputs поддерживает счетчики, по умолчанию они отключены. Группа счетчиков - это имя класса AvroMultipleOutputs. Имена счетчиков совпадают с именами выходов. Они подсчитывают количество записей, записанных для каждого имени вывода.

также посмотреть на

+0

Смотрит AvroMultipleOutputs используется для MR, но может» t использовать в искре непосредственно ... – Tom

+0

'MultipleOutputsFormatTest' вы видели? –

+0

Спасибо @RamPrasad G. Позвольте мне попробовать, спасибо! – Tom