У меня есть rdd, который распределяется по нескольким машинам в искровой среде. Я хотел бы выполнить функцию на каждом рабочем компьютере на этом rdd. Я не хочу собирать rdd, а затем выполнять функцию в драйвере. Функция должна выполняться отдельно для каждого исполнителя для собственного rdd. Как я могу это сделатьЗадача apache spark running на каждом rdd
Update (добавление кода) Я бегу все это в свече оболочки
import org.apache.spark.sql.cassandra.CassandraSQLContext
import java.util.Properties
val cc = new CassandraSQLContext(sc)
val rdd = cc.sql("select * from sams.events where appname = 'test'");
val df = rdd.select("appname", "assetname");
Здесь у меня есть ФР с 400 строками. Мне нужно сохранить эту таблицу df в sql server. Когда я пытаюсь использовать df.write метод дает мне ошибки, которые я разместил в отдельном потоке spark dataframe not appending to the table
я могу открыть DriverManager и вставить СВЯЗЬ строк, но это будет сделано в модуле драйвера искры
import java.sql._
import com.microsoft.sqlserver.jdbc.SQLServerDriver
// create a Statement from the connection
Statement statement = conn.createStatement();
// insert the data
statement.executeUpdate("INSERT INTO Customers " + "VALUES (1001, 'Simpson', 'Mr.', 'Springfield', 2001)");
String connectionUrl = "jdbc:sqlserver://localhost:1433;" +
"databaseName=AdventureWorks;user=MyUserName;password=*****;";
Connection con = DriverManager.getConnection(connectionUrl);
Мне нужно сделать это на машинке исполнителя. Как я могу это достичь?
Это нормальная операция искры. Вы бы опубликовали код, над которым работаете? Вам может потребоваться некоторое руководство в хорошем направлении. – maasg
У меня есть dataframe, который содержит коллекции строк sql. Теперь я получаю этот dataframe от cassandracql. Я обрабатываю этот фрейм данных и должен писать этот файл данных на сервер sql. Я не могу использовать jdbc метод dataframewriter, поэтому я использую insert в statement. – Nipun
после прочтения об искрах, я прочитал, что код, как правило, работает в драйвере, и какая-то операция, которую необходимо выполнить, выполняется на исполнителе. – Nipun