Я хотел бы превратить свой выходной массив:массив нагрузки Pig в Монго
У меня есть следующий код:
x = LOAD '$INPU'
USING PigStorage('\\u001')
AS (
product_id:chararray,
size:chararray
);
grouped = GROUP x BY (product_id);
sizes = FOREACH grouped {
sizes = DISTINCT $1.size;
GENERATE
$0 AS product_id,
sizes AS sizes;
}
output = foreach sizes generate
product_id as id,
sizes as sizes;
STORE output
INTO '$output'
USING com.mongodb.hadoop.pig.MongoInsertStorage('id');
этот результат следующее:
"product_id" :"123",
"sizes": [
{
"size": "X"
},
{
"size": "M"
},
{
"size": "L"
}
]
можно измените вывод на следующее? :
product_id: "123",
sizes": ["X", "M", "L"]
я попытался придавить и BagToTuple, но не смог найти решение
заранее спасибо
Я использую обновление mongo, чтобы упростить проблему, которую я использовал в этом примере. – clairvoyant
и есть ли способ создать список строк просто? как размеры: X, M, L? – clairvoyant
Можете ли вы включить команду обновления, которую вы использовали в своем вопросе? – Eyal