20春南开《大数据开发技术(二)》(1709、1803、1809、1903、1909、2003)在线作业
20春学期(1709、1803、1809、1903、1909、2003)《大数据开发技术(二)》在线作业
1.[单选题] Scala中合并两个数组的方法是()
奥鹏作业答案
A.line
B.add
C.append
D.concat
正确答案:——D——
2.[单选题] 以下哪个函数可以对RDD进行排序()
A.sortBy
B.filter
C.distinct
D.intersection
正确答案:——A——
3.[单选题] Graph类中如果要直接通过边数据文件创建图,要求数据按空格分隔,应该用()方法
A.Graph(vertices,edges, defaultVertexAttr)
B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D.GraphLoader.edgeListFile(sc,filename)
正确答案:——D——
4.[单选题] 下列Scala代码应输出():
var a=0;
var b=0
var sum=0;
for(a<-1 until 3; b<-1 until 3) {
sum+=a+b;
}
println(sum);
A.36
B.35
C.11
D.12
正确答案:————
5.[单选题] GraphX中()是提供顶点的各种操作方法的对象
A.RDD[Edge]
B.EdgeRDD
C.RDD[(VertexId,VD)]
D.VertexRDD
正确答案:————
6.[单选题] Scala列表方法中返回所有元素,除了最后一个的方法是()
A.drop
B.head
C.filter Q 7 612 96021
D.init
正确答案:————
7.[单选题] Dstream输出操作中()方法在Driver中打印出DStream中数据的前12个元素。
A.print
B.saveAsTextFiles
C.saveAsObjectFiles
D.saveAsHadoopFiles
正确答案:————
8.[单选题] ()是Spark的核心,提供底层框架及核心支持
A.Spark Core
B.Spark SQL
C.Spark Streaming
D.Mllib
正确答案:————
9.[单选题] 如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()
A.[0,numPartitions]
B.[0,numPartitions-1]
C.[1,numPartitions-1]
D.[1,numPartitions]
正确答案:————
10.[单选题] PairRDD中()函数可以对具有相同键的值进行分组
A.mapValues
B.groupBy
C.groupByKey
D.reduceByKey
正确答案:————
11.[单选题] GraphX中()方法可以缓存整个图,并指定存储级别
A.cache
B.presist
C.unpersistVertices
D.edges.unpersist
正确答案:————
12.[单选题] 当需要将一个普通的RDD转化为一个PairRDD时可以使用()函数来进行操作
A.transfer
B.change
C.map
D.build
正确答案:————
13.[单选题] Dstream窗口操作中()方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的Dstream
A.window
B.countByWindow
C.reduceByWindow
D.reduceByKeyAndWindow
正确答案:————
14.[单选题] spark-submit配置项中()表示executor使用的总核数
A.--num-executors NUM
B.--executor-memory MEM
C.--total-executor-cores NUM
D.--executor-coures NUM
正确答案:————
15.[单选题] 图结构中如果任意两个顶点之间都存在边,那么称之为()
A.完全图
B.有向完全图
C.无向图
D.简单图
正确答案:————
16.[单选题] 以下哪个函数可以求两个RDD的笛卡尔积()
A.union
B.substract
C.intersection
D.cartesian
正确答案:————
17.[单选题] Scala类通过子类化和基于灵活的混合类来进行扩展,作为##的一个可靠性解决方案
A.多态
B.虚函数
C.派生
D.多重继承
正确答案:————
18.[单选题] MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练分类树
A.trainClassifier
B.trainRegressor
C.LogisticRegressionModel
D.LabeledPoint
正确答案:————
19.[单选题] 以下哪个不是Scala的数据类型()
A.Int
B.Short Int
C.Long
D.Any
正确答案:————
20.[单选题] Mllib中metrics.precisionByThreshold表示()指标
A.准确度
B.召回率
C.F值
D.ROC曲线
正确答案:————
21.[单选题] PairRDD可以通过()获得仅包含键的RDD
A.key
B.keys
C.value
D.values
正确答案:————
22.[单选题] RDD的()操作通常用来划分单词
A.filter
B.union
C.flatmap
D.mapPartitions
正确答案:————
23.[单选题] 请问RDD的()操作作用于K-V类型的RDD上,返回指定K的所有V值
A.search
B.find
C.findByKey
D.lookup
正确答案:————
24.[单选题] 图的结构通常表示为:G(V,E),其中,V是图G中()
A.顶点
B.顶点的集合
C.边
D.边的集合
正确答案:————
25.[单选题] 一般情况下,对于迭代次数较多的应用程序,Spark程序在内存中的运行速度是Hadoop MapReduce运行速度的()多倍
A.2
B.10
C.100
D.1000
正确答案:————
26.[多选题] PairRDD中()函数可以进行分组
A.mapValues
B.groupBy
C.groupByKey
D.reduceByKey
正确答案:————
27.[多选题] Spark创建DataFrame对象方式有()
A.结构化数据文件
B.外部数据库
C.RDD
D.Hive中的表
正确答案:————
28.[多选题] Spark DataFrame中()方法可以返回一个Array对象
A.collect
B.take
C.takeAsList
D.collectAsList
正确答案:————
29.[多选题] Spark Core包含的功能有()
A.任务调度
B.内存管理
C.SQL查询
D.容错机制
正确答案:————
30.[多选题] Spark Streaming能够和()无缝集成
A.Hadoop
B.Spark SQL
C.Mllib
D.GraphX
正确答案:————
31.[多选题] 以下是机器学习的常用算法的是()
A.回归算法
B.聚类算法
C.降维算法
D.分类算法
正确答案:————
32.[多选题] Scala支持()
A.匿名函数
B.高阶函数
C.函数嵌套
D.柯里化
正确答案:————
33.[多选题] Spark中DataFrame的()方法是查询指定字段的数据信息
A.select
B.selectExpr
C.col
D.apply
正确答案:————
34.[多选题] Spark可以通过哪些外部存储创建RDD()
A.文本文件
B.目录
C.压缩文件
D.通配符匹配的文件
正确答案:————
35.[多选题] Scala中使用() 方法来连接两个集合
A.append
B.++
C.concat
D.Set.++()
正确答案:————
36.[判断题] Scala可以通过“val” 来定义变量,通过“var” 关键字来定义常量
A.对
B.错
正确答案:————
37.[判断题] Scala中列表是可变的
A.对
B.错
正确答案:————
38.[判断题] MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API。
A.对
B.错
正确答案:————
39.[判断题] RDD的union函数会将两个RDD元素合并成一个并且去处重复元素
A.对
B.错
正确答案:————
40.[判断题] 聚类是一种无监督学习的方法,用于将高度相似的数据分到一类中
A.对
B.错
正确答案:————
41.[判断题] Spark SQL包括基本的SQL语法和HiveQL语法
A.对
B.错
正确答案:————
42.[判断题] Scala函数组合器中flatten可以把嵌套的结构展开
A.对
B.错
正确答案:————
43.[判断题] Scala中默认情况下使用的是可变的Map
A.对
B.错
正确答案:————
44.[判断题] Scala在子类中重写超类的抽象方法时,需要使用override关键字
A.对
B.错
正确答案:————
45.[判断题] Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括函数式编程的特性。
A.对
B.错
正确答案:————
46.[判断题] Scala 语言中提供的数组是用来存储动态大小的同类型元素
A.对
B.错
正确答案:————
47.[判断题] RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。
A.对
B.错
正确答案:————
48.[判断题] Scala调用匿名函数可以将函数赋值给一个常量或变量,然后通过常量名或变量名调用该函数
A.对
B.错
正确答案:————
49.[判断题] Scala中允许集成多个父类
A.对
B.错
正确答案:————
50.[判断题] val如同Java里面的非final变量,可以在它的声明周期中被多次赋值。
A.对
B.错
正确答案:————
,附件是答案,请
1.[单选题] Scala中合并两个数组的方法是()
奥鹏作业答案
A.line
B.add
C.append
D.concat
正确答案:——D——
2.[单选题] 以下哪个函数可以对RDD进行排序()
A.sortBy
B.filter
C.distinct
D.intersection
正确答案:——A——
3.[单选题] Graph类中如果要直接通过边数据文件创建图,要求数据按空格分隔,应该用()方法
A.Graph(vertices,edges, defaultVertexAttr)
B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D.GraphLoader.edgeListFile(sc,filename)
正确答案:——D——
4.[单选题] 下列Scala代码应输出():
var a=0;
var b=0
var sum=0;
for(a<-1 until 3; b<-1 until 3) {
sum+=a+b;
}
println(sum);
A.36
B.35
C.11
D.12
正确答案:————
5.[单选题] GraphX中()是提供顶点的各种操作方法的对象
A.RDD[Edge]
B.EdgeRDD
C.RDD[(VertexId,VD)]
D.VertexRDD
正确答案:————
6.[单选题] Scala列表方法中返回所有元素,除了最后一个的方法是()
A.drop
B.head
C.filter Q 7 612 96021
D.init
正确答案:————
7.[单选题] Dstream输出操作中()方法在Driver中打印出DStream中数据的前12个元素。
A.print
B.saveAsTextFiles
C.saveAsObjectFiles
D.saveAsHadoopFiles
正确答案:————
8.[单选题] ()是Spark的核心,提供底层框架及核心支持
A.Spark Core
B.Spark SQL
C.Spark Streaming
D.Mllib
正确答案:————
9.[单选题] 如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()
A.[0,numPartitions]
B.[0,numPartitions-1]
C.[1,numPartitions-1]
D.[1,numPartitions]
正确答案:————
10.[单选题] PairRDD中()函数可以对具有相同键的值进行分组
A.mapValues
B.groupBy
C.groupByKey
D.reduceByKey
正确答案:————
11.[单选题] GraphX中()方法可以缓存整个图,并指定存储级别
A.cache
B.presist
C.unpersistVertices
D.edges.unpersist
正确答案:————
12.[单选题] 当需要将一个普通的RDD转化为一个PairRDD时可以使用()函数来进行操作
A.transfer
B.change
C.map
D.build
正确答案:————
13.[单选题] Dstream窗口操作中()方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的Dstream
A.window
B.countByWindow
C.reduceByWindow
D.reduceByKeyAndWindow
正确答案:————
14.[单选题] spark-submit配置项中()表示executor使用的总核数
A.--num-executors NUM
B.--executor-memory MEM
C.--total-executor-cores NUM
D.--executor-coures NUM
正确答案:————
15.[单选题] 图结构中如果任意两个顶点之间都存在边,那么称之为()
A.完全图
B.有向完全图
C.无向图
D.简单图
正确答案:————
16.[单选题] 以下哪个函数可以求两个RDD的笛卡尔积()
A.union
B.substract
C.intersection
D.cartesian
正确答案:————
17.[单选题] Scala类通过子类化和基于灵活的混合类来进行扩展,作为##的一个可靠性解决方案
A.多态
B.虚函数
C.派生
D.多重继承
正确答案:————
18.[单选题] MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练分类树
A.trainClassifier
B.trainRegressor
C.LogisticRegressionModel
D.LabeledPoint
正确答案:————
19.[单选题] 以下哪个不是Scala的数据类型()
A.Int
B.Short Int
C.Long
D.Any
正确答案:————
20.[单选题] Mllib中metrics.precisionByThreshold表示()指标
A.准确度
B.召回率
C.F值
D.ROC曲线
正确答案:————
21.[单选题] PairRDD可以通过()获得仅包含键的RDD
A.key
B.keys
C.value
D.values
正确答案:————
22.[单选题] RDD的()操作通常用来划分单词
A.filter
B.union
C.flatmap
D.mapPartitions
正确答案:————
23.[单选题] 请问RDD的()操作作用于K-V类型的RDD上,返回指定K的所有V值
A.search
B.find
C.findByKey
D.lookup
正确答案:————
24.[单选题] 图的结构通常表示为:G(V,E),其中,V是图G中()
A.顶点
B.顶点的集合
C.边
D.边的集合
正确答案:————
25.[单选题] 一般情况下,对于迭代次数较多的应用程序,Spark程序在内存中的运行速度是Hadoop MapReduce运行速度的()多倍
A.2
B.10
C.100
D.1000
正确答案:————
26.[多选题] PairRDD中()函数可以进行分组
A.mapValues
B.groupBy
C.groupByKey
D.reduceByKey
正确答案:————
27.[多选题] Spark创建DataFrame对象方式有()
A.结构化数据文件
B.外部数据库
C.RDD
D.Hive中的表
正确答案:————
28.[多选题] Spark DataFrame中()方法可以返回一个Array对象
A.collect
B.take
C.takeAsList
D.collectAsList
正确答案:————
29.[多选题] Spark Core包含的功能有()
A.任务调度
B.内存管理
C.SQL查询
D.容错机制
正确答案:————
30.[多选题] Spark Streaming能够和()无缝集成
A.Hadoop
B.Spark SQL
C.Mllib
D.GraphX
正确答案:————
31.[多选题] 以下是机器学习的常用算法的是()
A.回归算法
B.聚类算法
C.降维算法
D.分类算法
正确答案:————
32.[多选题] Scala支持()
A.匿名函数
B.高阶函数
C.函数嵌套
D.柯里化
正确答案:————
33.[多选题] Spark中DataFrame的()方法是查询指定字段的数据信息
A.select
B.selectExpr
C.col
D.apply
正确答案:————
34.[多选题] Spark可以通过哪些外部存储创建RDD()
A.文本文件
B.目录
C.压缩文件
D.通配符匹配的文件
正确答案:————
35.[多选题] Scala中使用() 方法来连接两个集合
A.append
B.++
C.concat
D.Set.++()
正确答案:————
36.[判断题] Scala可以通过“val” 来定义变量,通过“var” 关键字来定义常量
A.对
B.错
正确答案:————
37.[判断题] Scala中列表是可变的
A.对
B.错
正确答案:————
38.[判断题] MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API。
A.对
B.错
正确答案:————
39.[判断题] RDD的union函数会将两个RDD元素合并成一个并且去处重复元素
A.对
B.错
正确答案:————
40.[判断题] 聚类是一种无监督学习的方法,用于将高度相似的数据分到一类中
A.对
B.错
正确答案:————
41.[判断题] Spark SQL包括基本的SQL语法和HiveQL语法
A.对
B.错
正确答案:————
42.[判断题] Scala函数组合器中flatten可以把嵌套的结构展开
A.对
B.错
正确答案:————
43.[判断题] Scala中默认情况下使用的是可变的Map
A.对
B.错
正确答案:————
44.[判断题] Scala在子类中重写超类的抽象方法时,需要使用override关键字
A.对
B.错
正确答案:————
45.[判断题] Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括函数式编程的特性。
A.对
B.错
正确答案:————
46.[判断题] Scala 语言中提供的数组是用来存储动态大小的同类型元素
A.对
B.错
正确答案:————
47.[判断题] RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。
A.对
B.错
正确答案:————
48.[判断题] Scala调用匿名函数可以将函数赋值给一个常量或变量,然后通过常量名或变量名调用该函数
A.对
B.错
正确答案:————
49.[判断题] Scala中允许集成多个父类
A.对
B.错
正确答案:————
50.[判断题] val如同Java里面的非final变量,可以在它的声明周期中被多次赋值。
A.对
B.错
正确答案:————
,附件是答案,请
版权声明
声明:有的资源均来自网络转载,版权归原作者所有,如有侵犯到您的权益
请联系本站我们将配合处理!