多项选择题
A.每个Executor(线程)可以运行多个Task(任务) B.每个Worker可以运行多个Executor(线程) C.每个Worker只能为一个拓扑运行Executor(线程) D.每个Executor(线程)可以运行不同组件(Spout或Bolt)的Task(任务)
在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶...
单项选择题在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能。FusionInsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升性能?()
A.groupby B.coalosce C.connect D.join
FusionInsight HD中HBase默认使用什么组件作为其底层文件存储系统?()A.FileB.Kaf...
单项选择题FusionInsight HD中HBase默认使用什么组件作为其底层文件存储系统?()
A.File B.Kafka C.HDFS D.Memory
以下哪些是Kafka实际的应用场景?()A.网站活性跟踪B.日志收集C.聚合统计系统运营数据(监控数据)D.资...
多项选择题以下哪些是Kafka实际的应用场景?()
A.网站活性跟踪 B.日志收集 C.聚合统计系统运营数据(监控数据) D.资源管理