2015-11-17 5 views
0

Я понимаю, писать в формат ORC + мгновенным сжатие (свинья сценарий),формата ORC - PIG - зависимые библиотеки

с использованием OrcStorage ('- C мгновенного')

мне нужна ваша помощь, что является SET или необходимую библиотеку, которую мне нужно включить, чтобы включить сохранение набора данных результата в формат ORC?

Пожалуйста, помогите.

Subra

ответ

2

Проверьте, какая версия свиньи вы используете. Хранение ORC доступно от pig14 в качестве встроенной функции. Проверьте примеры: https://pig.apache.org/docs/r0.14.0/func.html#OrcStorage

UPDATE

Эта свинья просто прекрасно работает:

data = LOAD 'SO/date.txt' USING PigStorage(' ') AS (ts:chararray); 
STORE data INTO 'orc/snappy' using OrcStorage('-c SNAPPY'); 
data_orc = LOAD 'orc/snappy' using OrcStorage('-c SNAPPY'); 
DUMP data_orc; 

Вам даже не нужно зарегистрировать Kryo банку, потому что не используется непосредственно от свиньи так он будет оптимизирован, но вы используете его с помощью отражения, поэтому вам нужно добавить крио-кластер к пути к классу, например:

pig -latest -useHCatalog -cp ./kryo-2.24.0.jar orc.pig 
+0

свиной sc ript не удалось проверить: java.lang.RuntimeException: не удалось создать экземпляр «OrcStorage» с аргументами «[-c Snappy]» – user3924573

+0

Я получаю следующую ошибку, сценарий свиньи не удалось проверить: java.lang.RuntimeException: не удалось создать экземпляр ' OrcStorage 'с аргументами' [-c Snappy] 'Я использовал SET mapred.output.compression.codec org.apache.hadoop.io.compress.SnappyCodec. Что еще мне не хватает. Я использую версию свиньи 0.15. – user3924573

+0

Я сменил Snappy на SNAPPY. Теперь, я получаю, ERROR org.apache.pig.tools.grunt.GruntParser - ERROR 2997: невозможно воссоздать исключение из резервной ошибки: Ошибка: org/iq80/snappy/Snappy. Мое последнее утверждение: STORE OmniGen в '/ demo/output4', используя OrcStorage ('- c SNAPPY'); – user3924573

Смежные вопросы