Я использую Flume для объединения небольших файлов Avro (каждый из которых содержит пару событий Avro) в файлы большего размера, которые будут храниться в HDFS. Я использую источник Spool и HDFS-раковину, с Avro Serializer. Каталог My Spool содержит файлы с тремя различными схемами. Можно ли сконфигурировать Flume таким образом, чтобы он объединял файлы Avro с каждой другой схемой в разные файлы раковины?flume с несколькими схемами Avro
Заранее благодарен
Спасибо за ваше замечание Эрик; это было для меня настороже; факт, что тело содержит объект avro. Еще одна вещь, которая стоит упомянуть, - если вы используете AVRO_EVENT как сериализатор в hdfs-приемнике, тогда он фактически напишет весь (внешний) объект avro, а на самом деле вам, вероятно, нужен только внутренний объект avro. Это можно сделать, установив сериализатор в org.apache.flume.sink.hdfs.AvroEventSerializer $ Builder, который берет схему либо из LITERAL, либо из uri; см. код флюма в основном ... –
это правильно, серийный серийник по умолчанию будет просто писать формат avm –