3
Что такое строго типизированный API и нетипизированный API в отношении наборов данных Spark?Spark Datasets - сильная типизация
Как наборы данных аналогичны/отличаются от DataFrames?
Что такое строго типизированный API и нетипизированный API в отношении наборов данных Spark?Spark Datasets - сильная типизация
Как наборы данных аналогичны/отличаются от DataFrames?
API-интерфейсы Dataframe являются нетипизированными API, так как тип будет известен только во время выполнения. В то время как API-интерфейсы набора данных являются типизированными API-интерфейсами, для которых тип будет известен во время компиляции.
df.select("device").where("signal > 10") // using untyped APIs
ds.filter(_.signal > 10).map(_.device) // using typed APIs
Может кто-нибудь ответить на этот вопрос. –
Ссылка объяснила разницу между набором данных и dataframe. http://stackoverflow.com/questions/31508083/difference-between-dataframe-and-rdd-in-spark/39033308?noredirect=1#comment68807827_39033308 –