单项选择题
A.客户端缓存有集群的拓扑信息 B.服务端缓存有集群的拓扑信息 C.两者都是 D.两者都不是
在Spark中,假设lines是一个DStream对象,filter语句可以过滤掉80%的数据,针对以下两个语句说法正确的是:() X:lines.filter(...).groupByKey(...) Y:lines.groupByKey(...).filter(...)
A.X比Y的性能更高 B.X比Y的性能更低 C.X和Y和性能一样 D.无法确性X和丫的性能差异
A.分桶表,按照天分桶 B.分区表,按天分区 C.倾斜表,倾斜字段选择日期,倾斜值随机 D.分区+分桶表,按照时间分区,每个分区2560个桶
微信扫一扫,加关注免费搜题