多项选择题
A.直接使用mahout算法,在namenode机器的本地文件系统中调用这18828个文件 B.将这18828个文件上传到hdfs上,然后使用mahout算法分析 C.使用mahoutᨀ供的seqdirectory命令将18828个文件序列化成一个大文件上传到hdfs上,然后使用mahout算法分析 D.将这18828个文件rar压缩软件将其压缩成一个大文件上传到hdfs上,然后使用mahout算法分析
给定一个巨大的文本(如1TB),可以编写mapreduce程序计算单词出现的数目,需要经历如下哪几个步骤()A...
多项选择题给定一个巨大的文本(如1TB),可以编写mapreduce程序计算单词出现的数目,需要经历如下哪几个步骤()
A.自动对文本进行分割 B.对分割后的每一个KV对应用用户定义的Map进行处理,生成新的KV对 C.对输出的结果集归拢、排序(系统自动完成) D.通过Reduce操作生成最后结果
Mahout中实现的canopy聚类命令的可选参数是()A.–input偏好数据路径B.–output推荐结果...
多项选择题Mahout中实现的canopy聚类命令的可选参数是()
A.–input偏好数据路径 B.–output推荐结果路径 C.--t1(-t1)t1:T1阈值 D.--t2(-t2)t2:T2阈值
Mahout中实现的kmeans聚类命令的必选参数是()A.–input偏好数据路径B.–output推荐结果...
多项选择题Mahout中实现的kmeans聚类命令的必选参数是()
A.–input偏好数据路径 B.–output推荐结果路径 C.–clusters初始聚类中心点文件路径 D.--overwrite对输出路径进行重写