判断题
正确(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
以下关于Kafka的描述错误的有?()A.使用Scala、Java语言实现B.用作活动流和运营数据处理管道的基...
单项选择题以下关于Kafka的描述错误的有?()
A.使用Scala、Java语言实现 B.用作活动流和运营数据处理管道的基础 C.由ApacheHadoop开发,并于2011年开源 D.具有消息持久化、高吞吐、实时等特性
下列关于Worker(工作进程)、Executor(线程)、Task(任务)说法正确的是?()A.每个Exec...
多项选择题下列关于Worker(工作进程)、Executor(线程)、Task(任务)说法正确的是?()
A.每个Executor(线程)可以运行多个Task(任务) B.每个Worker可以运行多个Executor(线程) C.每个Worker只能为一个拓扑运行Executor(线程) D.每个Executor(线程)可以运行不同组件(Spout或Bolt)的Task(任务)
在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶...
单项选择题在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能。FusionInsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升性能?()
A.groupby B.coalosce C.connect D.join