2016-11-09 5 views
3

Что такое строго типизированный API и нетипизированный API в отношении наборов данных Spark?Spark Datasets - сильная типизация

Как наборы данных аналогичны/отличаются от DataFrames?

+0

Может кто-нибудь ответить на этот вопрос. –

+0

Ссылка объяснила разницу между набором данных и dataframe. http://stackoverflow.com/questions/31508083/difference-between-dataframe-and-rdd-in-spark/39033308?noredirect=1#comment68807827_39033308 –

ответ

2

API-интерфейсы Dataframe являются нетипизированными API, так как тип будет известен только во время выполнения. В то время как API-интерфейсы набора данных являются типизированными API-интерфейсами, для которых тип будет известен во время компиляции.

df.select("device").where("signal > 10")  // using untyped APIs 
ds.filter(_.signal > 10).map(_.device)   // using typed APIs 
Смежные вопросы