2014-09-01 2 views
0

Я новичок в выставке Pig. Каким будет эффективный способ анализа данных? Я смотрю на сбор каждого значения поля после = оператора как дата, время, имя_устройства и т.д.Разбор данных с несколькими разделителями с использованием свиньи

Jun 24 05:25:01 23.45.56.222 date=2014-06-24 time=05:04:43 devname=XX-FGT-Primary 
device_id=FG3K8A3408600390 log_id=0021000002 type=traffic subtype=allowed pri=notice 
vd=XX-Internet src=23.83.57.99 src_port=7569 src_int="amc-sw1/2" dst=23.91.19.16 
dst_port=343 dst_int="amc-sw1/1" SN=116445695565 status=accept policyid=2272 
dst_country="India" src_country="India" dir_disp=org tran_disp=noop service=HTTPS 
proto=6 duration=122 sent=124 rcvd=84 sent_pkt=3 rcvd_pkt=2  

Все фрагменты кода действительно поможет.

ответ

0

Я думаю, что вы ищете UDF под названием REGEX_EXTRACT_ALL.

И для фрагмента кода смотрите here.

+0

Большое спасибо Микко Купсу –

Смежные вопросы