У меня есть файл данных, который не имеет идентификационного номера (индекса). Можно ли создать индекс каждой записи с использованием UDF или любой встроенной функции у свиней ?. Например:Есть ли способ создать индекс в Pig Script?
data = load 'myfile.txt' using PigStorge(',') AS (speed:float, location:charrarray);
A = foreach data generate index as (Id:int), speed, location;
Я имею данные проблемы загрузки от свиньи Hbase потому что HBase считывает скорость, как строки-ключ и есть много повторяющихся данных (скорость) в моем файле. Я хочу установить индекс как значение строки строки и сохранить в таблице Hbase. Есть ли у вас какие-либо предположения? Спасибо.
Я уверяю вас, что вы просто используете его неправильно или не понимают, как работает модель данных. Он не является ни мусором, ни неполным. Вы должны узнать больше об этом, чтобы выяснить, что он может сделать для вас, но что вам нужно сделать, чтобы он работал правильно. Например, в 2010 году Facebook использовал HBase для хранения 135 миллиардов сообщений в месяц. Я уверен, что он сможет обрабатывать ваши данные датчика. http://highscalability.com/blog/2010/11/16/facebooks-new-real-time-messaging-system-hbase-to-store-135.html –
Спасибо, Дональд. Я решил это. – Aarav