2016-01-11 5 views
0

Я работаю на свинью, и мой набор данных выглядит следующим образомЧто означает эта схема для свинья?

a b c 
a e f 

я загрузить его в свинью, как этот

data = load 'temp' as (col1:chararray); 

и когда я describe data я получаю

data: {col1: chararray}

Что это значит? Означает ли это, что данные - это мешок с кортежами строк или мешка с цепочками? Потому что я делаю dump data, я получаю пакет кортежей.

не должно быть data:{(col1:chararray)}? Или они оба одинаковы?

ответ

1

Свинья имеет смешную привычку вмещать связь с фигурными скобками. Это легко сбить с мешком, но в вашем случае это просто означает, что отношение data состоит из одной колонки.

Кстати, с инструкцией загрузки у вас есть каждая строка будет одним кортежем. Если вы хотите иметь три, как предполагают ваши данные, вы должны сделать что-то вроде этого:

data = load 'temp' using PigStorage(' ') as (col1:chararray, col2:chararray, col3:chararray); 

описывает должен затем также показать что-то другое.

Смежные вопросы