у меня есть файл журнала с данными, как следующее:ScalaSpark - Создание пары RDD с ключом и список значений
1,2008-10-23 16:05:05.0,\N,Donald,Becton,2275 Washburn Street,Oakland,CA,94660,5100032418,2014-03-18 13:29:47.0,2014-03-18 13:29:47.0
2,2008-11-12 03:00:01.0,\N,Donna,Jones,3885 Elliott Street,San Francisco,CA,94171,4150835799,2014-03-18 13:29:47.0,2014-03-18 13:29:47.0
Мне нужно создать пару RDD с почтовым кодом в качестве ключа и список имен (Last Name,First Name)
в этом почтовом индексе как значение.
мне нужно использовать mapValues
и я сделал следующее:
val namesByPCode = accountsdata.keyBy(line => line.split(',')(8)).mapValues(fields => (fields(0), (fields(4), fields(5)))).collect()
, но я получаю сообщение об ошибке. может кто-нибудь сказать мне, что не так с моим заявлением?
какая ошибка вы получаете? – maasg