У меня есть файл, содержащий информацию переписи, которую я хотел бы запросить с помощью Pig.Как использовать свинг для уникальных значений
Формат файла выглядит следующим образом:
ID Name Year Gender State Count
1 Jones 1980 M MA 100
Я хотел бы получить процент для каждого имени для того государства, в этом году за каждый год в файле
Как я могу перебрать каждый лет и рассчитывать для каждого состояния процент появления каждого имени?
Результат должен выглядеть следующим образом:
1901 Jones MA 2%
1901 Jones VT 3%
1901 Smith MA 1%
1901 Lee VT 4%
....
....
2016 Jones MA 2%
2016 Jones VT 3%
2016 Smith MA 1%
2016 Lee VT 4%
За каждый год в таблице, мне нужно разбить его государством и в каждом государстве, мне нужно, чтобы вычислить процент для каждого имени данной информации граф.
пожалуйста, вы можете опубликовать формат результата вы ожидаете –
Исправленные оригинальный пост, чтобы включить результаты я ищу – TheGoat
Как процент определяется, например, 2%? –