У меня есть текстовые данные, как показано нижеСпарк RDD вопросы картографирования
no1 1|3|4 no2 4|5|6
и я хочу, чтобы преобразовать вышеуказанные данные, как показано ниже с помощью искрового RDD и язык SCALA.
no1 1 no1 3 no1 4 no2 4 no2 5 no2 6
Я очень новичок в Spark и Scala. И я не могу найти ни одного примера, который бы делал это.
Спасибо за Ваш комментарий. Если у меня есть файл txt данных и вы хотите его ввести (а не вручную), как получить команду для введенного пользователем файла? – sclee1
@ sclee1, изучая Spark. Я не скупился, просто вы не можете рассчитывать написать свое приложение только из последовательности вопросов, чтобы [SO]. Любое учебное пособие по искры будет охватывать чтение из файла. –
В зависимости от вашей искровой версии чтение из файла будет отличаться. Для искры 2+ я нахожу 'spark.read.option (« header »,« true »). Option (« inferSchema »,« true »). Csv (ваш файл)', который будет удобен в использовании. – Psidom