《大数据导论》在线作业南开大学19秋

所属学校:南开大学 科目:大数据导论 2020-03-26 17:19:35 南开大学 在线 作业 导论 数据
19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业
1.[单选题] 大数据的最显著特征是() 。
    A.数据规模大
    B.数据类型多样
    C.数据处理速度快
    D.数据价值密度高
    正确答案:——A——
2.[单选题] 用于描述数据分散情况的是()
    A.分布图
    B.箱式图
    C.饼图
    D.折线图
    正确答案:——B——
3.[单选题] 下列哪个工具常用来开发移动友好地交互地图()
    A.Leaflet
    B.Visual.ly
    C.BPizza Pie Charts
    D.Gephi
    正确答案:——A——
4.[单选题] 数据清洗的方法不包括
    A.缺失值处理
    B.噪声数据清除
    C.一致性检查
    D.重复数据记录处理
    正确答案:————
5.[单选题] 数据仓库是随着时间变化的,下列不正确的是()
    A.数据仓库随时间变化不断增加新内容
    B.捕捉到的新数据会覆盖原来的快照
    C.数据仓库随事件变化不断删去旧的数据内容
    D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
    正确答案:————
6.[单选题] 下列哪个R语言扩展包可以创建带有点和边的网络图()
    A.ggplot2
    B.network
    C.ggmaps
    D.animation
    正确答案:————
7.[单选题] IaaS是()的简称
    A.软件即服务
    B.平台即服务
    C.基础设施即服务
    D.硬件即服务
    正确答案:————
8.[单选题] 数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段(  )。
    A.运营式系统阶段
    B.用户原创内容阶段
    C.感知式系统阶段
    正确答案:————
9.[单选题] GFS中的文件切分成()的块进行存储
    A.32MB
    B.64MB
    C.128MB
    D.1G
    正确答案:————
10.[单选题] 以下不是数据仓库基本特征的是()
    A.数据仓库是面向主题的
    B.数据仓库是面向事务的
    C.数据仓库的数据是相对稳定的
    D.数据仓库的数据是反映历史变化的
    正确答案:————
11.[单选题] 以下哪项不是数据可视化工具的特性()
    A.实时性
    B.简单操作
    C.更丰富的展现
    D.仅需一种数据支持方式即可
    正确答案:————
12.[单选题] 第一个提出大数据概念的公司是(  )。
    A.麦肯锡公司
    B.谷歌公司
    C.微软公司
    D.脸谱公司
    正确答案:————
13.[单选题] 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
    A.ggplot2
    B.network
    C.ggmaps
    D.animation
    正确答案:————
14.[单选题] 用于描述相等时间间隔下连续数据随时间变化趋势的是()
    A.折线图
    B.散点图
    C.条形图
    D.饼图
    正确答案:————
15.[单选题] DAS代表的意思是()
    A.两个异步存储
    B.数据归档软件
    C.连接一个可选的存储
    D.直连存储
    正确答案:————
16.[多选题] 大数据采集主要包括()四种。
    A.系统日志采集
    B.网络数据采集
    C.数据库采集
    D.其他数据采集
    正确答案:————
17.[多选题] 基于大数据的临床决策支持系统的架构包括
    A.支撑层
    B.大数据分析层
    C.网络层
    D.应用层
    正确答案:————
18.[多选题] 可视化工具包括()
    A.Excel
    B.Google Chart
    C.Gephi
    D.ppt
    正确答案:————
19.[多选题] 大数据存储的特点与挑战有()
    A.容量问题
    B.延迟问题
    C.安全问题
    D.成本问题
    正确答案:————
20.[多选题] 传感器工作模式类别包括()
    A.基于位置
    B.基于活动
    C.基于设备
    正确答案:————
21.[多选题] 数据归约(Data Reduction)主要有有()
    A.维度规约
    B.样本规约
    C.数据聚集
    D.离散化概念分层
    正确答案:————
22.[多选题] 常见的非结构化数据有()
    A.web网页
    B.即时消息
    C.富文本文档
    D.实时多媒体数据
    正确答案:————
23.[多选题] 关于R语言扩展包下列正确的是()
    A.network可创建带有点和边的网络图
    B.animation可制作一系列的图像并将它们串联起来做成动画
    C.ggmaps通过树图来可视化层次型数据
    D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具
    正确答案:————
24.[多选题] 最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的()等。
    A.用户行为数据
    B.日志式的活动数据
    C.事件信息
    正确答案:————
25.[多选题] 数据预处理的过程主要是
    A.数据清洗
    B.数据集成
    C.数据变换
    D.数据规约
    正确答案:————
26.[多选题] 大数据时代预测人类移动行为的数据特点是
    A.多样化
    B.数据量大
    C.维数高
    D.变化快
    正确答案:————
27.[多选题] 常见的分类方法有
    A.决策树
    B.贝叶斯网络
    C.遗传算法
    D.FP算法
    正确答案:————
28.[多选题] 数据归约(Data Reduction)主要有()
    A.维度规约
    B.样本规约
    C.数据聚集
    D.离散化概念分层
    正确答案:————
29.[多选题] 大数据在教育中的应用
    A.网上公开课
    B.慕课
    C.智慧校园
    D.翻转课堂
    正确答案:————
30.[多选题] 云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
    A.流计算
    B.分布式计算
    C.并行计算
    D.网络计算
    正确答案:————
31.[判断题] 《科学》(Science)杂志专刊——Dealing with data,通过社会调查的方式,第一次综合分析了大数据对人们生活造成的影响,详细描述了人类面临的“数据困境”。
    A.对
    B.错
    正确答案:————
32.[判断题] NewSQL是对各种可扩展/高性能数据库的简称,这类数据库在保持了传统数据库支持ACID和SQL等能力的同时,还具有NoSQL对海量数据的存储管理能力。
    A.对
    B.错
    正确答案:————
33.[判断题] PaaS是平台即服务的简称
    A.对
    B.错
    正确答案:————
34.[判断题] 用户可以感知不同属性之间的相关性,过滤掉噪声和不相关的轨迹,用于进一步调查有趣的案例。分析人员可以交互式地逐步优化设置以改进结果。
    A.对
    B.错
    正确答案:————
35.[判断题] FP算法比Apriori算法慢
    A.对
    B.错
    正确答案:————
36.[判断题] 当数据量表完全超过BI和传统关系数据库的能力时,我们将用到海量数据分析。
    A.对
    B.错
    正确答案:————
37.[判断题] 广义的Spark是指Spark生态系统,采用了四层架构。
    A.对
    B.错
    正确答案:————
38.[判断题] 内存分析数据量比海量分析数据量大
    A.对
    B.错
    正确答案:————
39.[判断题] 数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式
    A.对
    B.错
    正确答案:————
40.[判断题] 数据可视化。将大型数据集中的数据通过图形图像方式表示,并利用数据分析和开发工具发现其中未知信息。
    A.对
    B.错
    正确答案:————
41.[判断题] 利用云存储中的多租户技术,满足了海量信息爆炸式增长趋势,一定程度上节约企业存储成本,提高效率。
    A.对
    B.错
    正确答案:————
42.[判断题] 事件是Flume的基本数据单位
    A.对
    B.错
    正确答案:————
43.[判断题] 大数据可视化便于人们对数据的理解
    A.对
    B.错
    正确答案:————
44.[判断题] 用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或分析道路段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。
    A.对
    B.错
    正确答案:————
45.[判断题] 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。
    A.对
    B.错
    正确答案:————
46.[判断题] 数据挖掘主要是为了发现隐藏在数据中的有用信息和规律
    A.对
    B.错
    正确答案:————
47.[判断题] 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”
    A.对
    B.错
    正确答案:————
48.[判断题] 在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。
    A.对
    B.错
    正确答案:————
49.[判断题] 大数据数据量一定是PB,TB级的
    A.对
    B.错
    正确答案:————
50.[判断题] 美国《自然》(Nature)杂志专刊——The next google,第一次正式提出“大数据”概念。
    A.对
    B.错
    正确答案:————


版权声明

声明:有的资源均来自网络转载,版权归原作者所有,如有侵犯到您的权益 请联系本站我们将配合处理!

分享: