У меня есть образец свиной скрипт с данными, которые будут читать csv-файл и выгружать его из экрана; однако мои данные имеют пары значений имени. как я могу прочитать в строке пар значений имени и разделить пары, используя имя для поля и значение для значения?Apache Pig чтение значений пар значений в файле данных
данные:
1,Smith,Bob,Business Development
2,Doe,John,Developer
3,Jane,Sally,Tester
Сценарий:
data = LOAD 'example-data.txt' USING PigStorage(',')
AS (id:chararray, last_name:chararray,
first_name:chararray, role:chararray);
DESCRIBE data;
DUMP data;
выход:
data: {id: chararray,last_name: chararray,first_name: chararray,role: chararray}
(1,Smith,Bob,Business Development)
(2,Doe,John,Developer)
(3,Jane,Sally,Tester)
однако, учитывая следующие входные (в виде пар имя-значение); как я могу обрабатывать данные, чтобы получить один и тот же «объект данных»?
id=1,last_name=Smith,first_name=Bob,role=Business Development
id=2,last_name=Doe,first_name=John,role=Developer
id=3,last_name=Jane,first_name=Sally,role=Tester
смысла иметь пары значений имени является то, что порядок не имеет значения; могу ли я установить окончательный GENERATE на v1 AS VALUE_OF (n1), ... что почему каждое имя переменной сохраняется как assoated со значением –