В общем случае использование данных PigStrorage (',') приведет к отсутствует savava143 (последнее значение поля)
A = LOAD '/Users/muralirao/learning/pig/a.csv' USING PigStorage(',') AS (f1,f2,f3);
DUMP A;
Выход: A: Заметим, что последнее значение поля отсутствует.
(396124437168537600,"I really wish I didn't give up everything I did for you, I'm so mad at my self for even letting it get as far as it did.")
Для случая использования совместно, чтобы извлечь все значения из CSV файла со значениями полей, имеющих «» мы можем использовать либо CSVExcelStorage или CSVLoader.
Подход 1: Использование CSVExcelStorage
Ref: http://pig.apache.org/docs/r0.12.0/api/org/apache/pig/piggybank/storage/CSVExcelStorage.html
Вход: a.csv
396124437168537600,"I really wish I didn't give up everything I did for you, I'm so mad at my self for even letting it get as far as it did.",savava143
Pig Сценарий:
REGISTER piggybank.jar;
A = LOAD 'a.csv' USING org.apache.pig.piggybank.storage.CSVExcelStorage() AS (f1,f2,f3);
DUMP A;
Выходные данные:
(396124437168537600,I really wish I didn't give up everything I did for you, I'm so mad at my self for even letting it get as far as it did.,savava143)
Подход 2: Использование CSVLoader
Ссылка: http://pig.apache.org/docs/r0.9.1/api/org/apache/pig/piggybank/storage/CSVLoader.html
Ниже скрипт использует CSVLoader(), дамп приведет к тем же выходом видели ранее.
A = LOAD 'a.csv' USING org.apache.pig.piggybank.storage.CSVLoader() AS (f1,f2,f3);