单项选择题
A.使用Scala、Java语言实现 B.用作活动流和运营数据处理管道的基础 C.由ApacheHadoop开发,并于2011年开源 D.具有消息持久化、高吞吐、实时等特性
下列关于Worker(工作进程)、Executor(线程)、Task(任务)说法正确的是?()A.每个Exec...
多项选择题下列关于Worker(工作进程)、Executor(线程)、Task(任务)说法正确的是?()
A.每个Executor(线程)可以运行多个Task(任务) B.每个Worker可以运行多个Executor(线程) C.每个Worker只能为一个拓扑运行Executor(线程) D.每个Executor(线程)可以运行不同组件(Spout或Bolt)的Task(任务)
在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶...
单项选择题在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能。FusionInsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升性能?()
A.groupby B.coalosce C.connect D.join
FusionInsight HD中HBase默认使用什么组件作为其底层文件存储系统?()A.FileB.Kaf...
单项选择题FusionInsight HD中HBase默认使用什么组件作为其底层文件存储系统?()
A.File B.Kafka C.HDFS D.Memory