欢迎来到牛牛题库网 牛牛题库官网
logo
全部科目 > 大学试题 > 计算机科学 > Apache Spark

多项选择题

下列关于RDD、DataFrame和DataSet描述正确的是()。

A.RDD、DataFrame、DataSet全都是spark平台下的分布式弹性数据集,为处理超大型数据提供便利
B.三者都有惰性机制,在进行创建、转换,如map方法时,不会立即执行,只有在遇到Action如foreach时,三者才会开始遍历运算
C.在对DataFrame和Dataset进行操作许多操作都需要进行引入:import spark.implicits._
D.DataFrame可以通过toDS转化为DataSet

点击查看答案&解析
微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题