Я пытаюсь напечатать одну колонку из файла паркета, используя паркет-tools.jar (https://github.com/Parquet/parquet-mr/tree/master/parquet-tools). Я использую эту команду:Недопустимые аргументы, выполняемые паркет-инструменты jar
java -jar parquet-tools-1.6.1-SNAPSHOT.jar dump -c COLUMNNAME someParquet.parquet
Но я получаю:
Invalid arguments: missing required arguments
usage: parquet-dump [option...] <input>
where option is one of:
-c,--column <arg> Dump only the given column, can be specified more than
once
-d,--disable-data Do not dump column data
--debug Enable debug output
-h,--help Show this help string
-m,--disable-meta Do not dump row group and page metadata
--no-color Disable color output even if supported
where <input> is the parquet file to print to stdout
Не знаю, где я получаю синтаксис неправильно.
Возможно, вы хотите использовать эти скрипты https://github.com/wesleypeck/parquet-tools/tree/master/src/main/scripts - это должно дать вам синтаксис, предложенный на странице справки –
Я думаю, вы получить синтаксис правильно. Кажется, это ошибка в библиотеке CLI Apache или в способе использования паркетных инструментов. – Zoltan
Согласен, кажется, проблема с использованием apache cli. попробуйте использовать '--column NAME',' --column = NAME' и т. д. – borowis