Мои файлы csv имеют заголовок в первой строке. Загрузка их в свиньи создает беспорядок на любых последующих функциях (например, SUM). На сегодняшний день я первый применить фильтр на загруженных данных, чтобы удалить строки, содержащие заголовки:Hadoop Pig - Удаление CSV-заголовка
affaires = load 'affaires.csv' using PigStorage(',') as (NU_AFFA:chararray, date:chararray) ;
affaires = filter affaires by date matches '../../..';
Я думаю, это немного глупо, как метод, и мне интересно, как есть способ сказать свинью не загружать первую строку csv, как логический параметр «as_header» в функцию загрузки. Я не вижу его на доке. Что было бы лучше? Как вы обычно справляетесь с этим?