Я только начал использовать Spark, и мои взаимодействия с ним вращаются вокруг spark-shell
на данный момент. Я хотел бы проверить, как долго выполняются различные команды, но не смогли найти, как получить время или запустить тест. В идеале я хотел бы сделать что-то супер-простой, таких как:Как измерить производительность в консоли Spark?
val t = [current_time]
data.map(etc).distinct().reduceByKey(_ + _)
println([current time] - t)
Edit: Понял это -
import org.joda.time._
val t_start = DateTime.now()
[[do stuff]]
val t_end = DateTime.now()
new Period(t_start, t_end).toStandardSeconds()
Пожалуйста, не забудьте принять ответ, чтобы закрыть его! – eliasah