После выполнения инструкции по установке кластера через скрипт ec2 я не могу правильно запустить мой .jar, потому что они не находят файл данных, который я накладываю/root/persistent-hdfs/на ведущий и ведомый узлы. Я прочитал на другом посту, что мне нужно префикс местоположения файла с файлом: // но это ничего не меняет ... У меня есть эта ошибка:Доступ к данным Spark EC2
Исключение в теме "main" org.apache.hadoop .mapred.InvalidInputException: входной путь не существует: файл: //root/persistent-hdfs/data/ds_1.csv
Для запуска задания я использовал ./bin/spark-submit на главном узле, am Я правильно?
Заранее благодарю вас за поддержку.
, пожалуйста, отправьте полную команду, которую вы подаете, чтобы отправить задание. Также разместите свой код работы. – vvladymyrov
Я использовал эту команду: spark_submit --class "MS1" MS1.jar – KyBe