20春南开《大数据开发技术（二）》（1709、1803、1809、1903、1909、2003）在线作业

所属学校：北京理工大学科目:大数据开发技术（二） 2020-04-22 17:19:15 在线南开作业数据技术

20春学期（1709、1803、1809、1903、1909、2003）《大数据开发技术（二）》在线作业
1.[单选题] Scala中合并两个数组的方法是（）
奥鹏作业答案
A.line
B.add
C.append
D.concat
正确答案:——D——
2.[单选题] 以下哪个函数可以对RDD进行排序（）
A.sortBy
B.filter
C.distinct
D.intersection
正确答案:——A——
3.[单选题] Graph类中如果要直接通过边数据文件创建图，要求数据按空格分隔，应该用（）方法
A.Graph(vertices,edges, defaultVertexAttr)
B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D.GraphLoader.edgeListFile(sc,filename)
正确答案:——D——
4.[单选题] 下列Scala代码应输出（）：
var a=0;
var b=0
var sum=0;
for(a＜-1 until 3; b＜-1 until 3) {
sum+=a+b;
}
println(sum);
A.36
B.35
C.11
D.12
正确答案:————
5.[单选题] GraphX中（）是提供顶点的各种操作方法的对象
A.RDD[Edge]
B.EdgeRDD
C.RDD[(VertexId,VD)]
D.VertexRDD
正确答案:————
6.[单选题] Scala列表方法中返回所有元素，除了最后一个的方法是（）
A.drop
B.head
C.filter Q 7 612 96021
D.init
正确答案:————
7.[单选题] Dstream输出操作中（）方法在Driver中打印出DStream中数据的前12个元素。
A.print
B.saveAsTextFiles
C.saveAsObjectFiles
D.saveAsHadoopFiles
正确答案:————
8.[单选题] （）是Spark的核心，提供底层框架及核心支持
A.Spark Core
B.Spark SQL
C.Spark Streaming
D.Mllib
正确答案:————
9.[单选题] 如果numPartitions是分区个数，那么Spark每个RDD的分区ID范围是（）
A.[0,numPartitions]
B.[0,numPartitions-1]
C.[1,numPartitions-1]
D.[1,numPartitions]
正确答案:————
10.[单选题] PairRDD中（）函数可以对具有相同键的值进行分组
A.mapValues
B.groupBy
C.groupByKey
D.reduceByKey
正确答案:————
11.[单选题] GraphX中（）方法可以缓存整个图，并指定存储级别
A.cache
B.presist
C.unpersistVertices
D.edges.unpersist
正确答案:————
12.[单选题] 当需要将一个普通的RDD转化为一个PairRDD时可以使用（）函数来进行操作
A.transfer
B.change
C.map
D.build
正确答案:————
13.[单选题] Dstream窗口操作中（）方法基于滑动窗口对（K，V）键值对类型的DStream中的值按K使用聚合函数func进行聚合操作，得到一个新的Dstream
A.window
B.countByWindow
C.reduceByWindow
D.reduceByKeyAndWindow
正确答案:————
14.[单选题] spark-submit配置项中（）表示executor使用的总核数
A.--num-executors NUM
B.--executor-memory MEM
C.--total-executor-cores NUM
D.--executor-coures NUM
正确答案:————
15.[单选题] 图结构中如果任意两个顶点之间都存在边，那么称之为（）
A.完全图
B.有向完全图
C.无向图
D.简单图
正确答案:————
16.[单选题] 以下哪个函数可以求两个RDD的笛卡尔积（）
A.union
B.substract
C.intersection
D.cartesian
正确答案:————
17.[单选题] Scala类通过子类化和基于灵活的混合类来进行扩展，作为##的一个可靠性解决方案
A.多态
B.虚函数
C.派生
D.多重继承
正确答案:————
18.[单选题] MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法（）训练分类树
A.trainClassifier
B.trainRegressor
C.LogisticRegressionModel
D.LabeledPoint
正确答案:————
19.[单选题] 以下哪个不是Scala的数据类型（）
A.Int
B.Short Int
C.Long
D.Any
正确答案:————
20.[单选题] Mllib中metrics.precisionByThreshold表示（）指标
A.准确度
B.召回率
C.F值
D.ROC曲线
正确答案:————
21.[单选题] PairRDD可以通过（）获得仅包含键的RDD
A.key
B.keys
C.value
D.values
正确答案:————
22.[单选题] RDD的（）操作通常用来划分单词
A.filter
B.union
C.flatmap
D.mapPartitions
正确答案:————
23.[单选题] 请问RDD的（）操作作用于K-V类型的RDD上，返回指定K的所有V值
A.search
B.find
C.findByKey
D.lookup
正确答案:————
24.[单选题] 图的结构通常表示为：G(V,E)，其中，V是图G中()
A.顶点
B.顶点的集合
C.边
D.边的集合
正确答案:————
25.[单选题] 一般情况下，对于迭代次数较多的应用程序，Spark程序在内存中的运行速度是Hadoop MapReduce运行速度的（）多倍
A.2
B.10
C.100
D.1000
正确答案:————
26.[多选题] PairRDD中（）函数可以进行分组
A.mapValues
B.groupBy
C.groupByKey
D.reduceByKey
正确答案:————
27.[多选题] Spark创建DataFrame对象方式有（）
A.结构化数据文件
B.外部数据库
C.RDD
D.Hive中的表
正确答案:————
28.[多选题] Spark DataFrame中（）方法可以返回一个Array对象
A.collect
B.take
C.takeAsList
D.collectAsList
正确答案:————
29.[多选题] Spark Core包含的功能有（）
A.任务调度
B.内存管理
C.SQL查询
D.容错机制
正确答案:————
30.[多选题] Spark Streaming能够和（）无缝集成
A.Hadoop
B.Spark SQL
C.Mllib
D.GraphX
正确答案:————
31.[多选题] 以下是机器学习的常用算法的是（）
A.回归算法
B.聚类算法
C.降维算法
D.分类算法
正确答案:————
32.[多选题] Scala支持（）
A.匿名函数
B.高阶函数
C.函数嵌套
D.柯里化
正确答案:————
33.[多选题] Spark中DataFrame的（）方法是查询指定字段的数据信息
A.select
B.selectExpr
C.col
D.apply
正确答案:————
34.[多选题] Spark可以通过哪些外部存储创建RDD（）
A.文本文件
B.目录
C.压缩文件
D.通配符匹配的文件
正确答案:————
35.[多选题] Scala中使用（）方法来连接两个集合
A.append
B.++
C.concat
D.Set.++()
正确答案:————
36.[判断题] Scala可以通过“val” 来定义变量，通过“var” 关键字来定义常量
A.对
B.错
正确答案:————
37.[判断题] Scala中列表是可变的
A.对
B.错
正确答案:————
38.[判断题] MLlib由一些通用的学习算法和工具组成，包括分类、回归、聚类、协同过滤、降维等，同时还包括底层的优化原语和高层的管道API。
A.对
B.错
正确答案:————
39.[判断题] RDD的union函数会将两个RDD元素合并成一个并且去处重复元素
A.对
B.错
正确答案:————
40.[判断题] 聚类是一种无监督学习的方法，用于将高度相似的数据分到一类中
A.对
B.错
正确答案:————
41.[判断题] Spark SQL包括基本的SQL语法和HiveQL语法
A.对
B.错
正确答案:————
42.[判断题] Scala函数组合器中flatten可以把嵌套的结构展开
A.对
B.错
正确答案:————
43.[判断题] Scala中默认情况下使用的是可变的Map
A.对
B.错
正确答案:————
44.[判断题] Scala在子类中重写超类的抽象方法时，需要使用override关键字
A.对
B.错
正确答案:————
45.[判断题] Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括函数式编程的特性。
A.对
B.错
正确答案:————
46.[判断题] Scala 语言中提供的数组是用来存储动态大小的同类型元素
A.对
B.错
正确答案:————
47.[判断题] RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD ，但是转换操作是懒操作，不会立刻执行计算。
A.对
B.错
正确答案:————
48.[判断题] Scala调用匿名函数可以将函数赋值给一个常量或变量，然后通过常量名或变量名调用该函数
A.对
B.错
正确答案:————
49.[判断题] Scala中允许集成多个父类
A.对
B.错
正确答案:————
50.[判断题] val如同Java里面的非final变量，可以在它的声明周期中被多次赋值。
A.对
B.错
正确答案:————

，附件是答案，请

版权声明

声明：有的资源均来自网络转载，版权归原作者所有，如有侵犯到您的权益请联系本站我们将配合处理！

上一篇 : 20春南开《大数据开发技术（一）》（1709、1803、1809、1903、1909、2003）在线作业

下一篇 :20春南开《大数据导论》（1709、1803、1809、1903、1909、2003）在线作业

20春南开《大数据开发技术（二）》（1709、1803、1809、1903、1909、2003）在线作业

版权声明

最近发表

热门信息

标签列表

20春南开《大数据开发技术（二）》（1709、1803、1809、1903、1909、2003）在线作业

版权声明

相关文章

最近发表

热门信息

标签列表