单项选择题
A.非实时分析,例如日志分析,统计分析 B.数据挖掘,例如用户行为分析,兴趣分析,区域展示 C.数据汇总,例如每天,每用户点击数,点击排行 D.实时在线数据分析
Hbase中OpenScanner的过程,会创建两种不同的Scanner来读取HFile和MemStore的数...
判断题Hbase中OpenScanner的过程,会创建两种不同的Scanner来读取HFile和MemStore的数据,HFile对应的Scanner为StoreFileScanner,MemStore对应的Scanner为MemStoreScanner。
关于DataSet,下列说法不正确的是?()A.DataSet不需要反序列化就可执行大部分操作B.DataSe...
单项选择题关于DataSet,下列说法不正确的是?()
A.DataSet不需要反序列化就可执行大部分操作 B.DataSet是一个由特定域的对象组成的强类型集合 C.DataSet与RDD高度类似,性能比RDD好 D.DataSet执行sort,filter,shuffle登操作需要进行反序列化
Spark根据RDD的依赖关系来划分Stage,调度器从DAG图末端出发,逆向遍历整个依赖关系链,遇到窄依赖就...
判断题Spark根据RDD的依赖关系来划分Stage,调度器从DAG图末端出发,逆向遍历整个依赖关系链,遇到窄依赖就断开,遇到宽依赖就将其加入当前Stage。