2015-12-29 5 views
-1

Я новичок в этой среде hadoop, и я хочу написать пользовательские файлы SerDe для EBCDIC. Я много искал в Интернете, но не получил никаких материалов о разработке SerDe. Если у вас есть идеи о разработке SerDe, разместите ссылки. Заранее спасибо.Пользовательский Serde для формата EBCDIC

+0

Приветствуем вас, чтобы переполнения стека, этот вопрос может рассматриваться не по теме, попробуйте переформулировать свой вопрос с подробностями о том, что вы пробовали или нашли до сих пор (вопросы, предлагающие нам рекомендовать или найти книгу, инструмент, библиотеку программного обеспечения , учебник или другой ресурс вне сайта не относятся к теме для переполнения стека, поскольку они склонны привлекать упрямые ответы и спам. Вместо этого опишите проблему и то, что было сделано до сих пор, чтобы ее решить. http://stackoverflow.com/help/по теме). –

+0

Сказать, что это файл EBCDIC, не очень полезен. EBCDIC - это набор символов (на самом деле это семейство наборов символов), и его можно читать так же, как любой файл ascii/utf-8 в java и т. Д. Что будет сложнее если это файл мэйнфрейма, у вас могут быть файлы FB/VB. Имеет ли файл двоичные/COBOL-зонированные десятичные поля, есть ли копия Cobol ??? –

ответ

0

Начните с официального Hive apache wikipage for SerDe, см. Исходный код встроенных реализаций Hive и на основе этого просто попробуйте написать свой собственный. Более того, я не верю, что вы не можете опубликовать какое-либо дополнительное сообщение в блоге или учебное пособие, касающееся этой темы.

+0

Привет, Марбу, Спасибо за ссылку. Я много искал и нашел документацию о существующих серде. Было очень мало и неполных данных о индивидуальном развитии. Это будет очень полезно, если вы можете поделиться учебником или любым блогом, который с самого начала объяснил процесс разработки Serde. Еще раз спасибо. –

+0

Когда цель состоит в том, чтобы переделать часть хорошо зарекомендовавшей себя системы для достижения новой особой функции, есть вероятность, что нет единого документа, который бы описывал все с нуля. Вы не можете рассчитывать на то, что найдете единственный учебник для внедрения нового SerDe для тех, кто вообще не знает внутренности Hive. Таким образом, лучший подход - начать изучать SerDe из официальных документов и других реализаций (это с открытым исходным кодом, yay!), И только после этого вы можете рассчитывать на понимание документов о пользовательской разработке serde. – marbu

Смежные вопросы