奥鹏浙江大学2013年秋《数据挖掘》在线作业

所属学校:浙江大学 科目:数据挖掘 2015-03-17 11:33:53

单选题  

1.置信度(confidence)是衡量兴趣度度量( )的指标。  

A 简洁性  B 确定性  C 实用性  D 新颖性  

正确答案:B 单选题  

2.哪种OLAP操作可以让用户在更高的抽象层,更概化的审视数据?  

A 上卷  B 下钻  C 切块  D 转轴  

正确答案:A 单选题  

3.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。  

A 关联分析  B 分类和预测  C 聚类分析  D 演变分析  

正确答案:A 单选题  

4.下列哪个描述是正确的?  

A 分类和聚类都是有指导的学习  B 分类和聚类都是无指导的学习  

C 分类是有指导的学习,聚类是无指导的学习  D 分类是无指导的学习,聚类是有指导的学习  正确答案:C单选题  

5.计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?

A 算术平均值  B 截尾均值  C 中位数  D 众数  

正确答案:B 单选题  

6.规则:age(X,”19-25”) ∧buys(X, “popcorn”) = buys(X, “coke”)是一个( )。

A 单维关联规则  B 多维关联规则  C 混合维关联规则  D 不是一个关联规则  

正确答案:B 单选题  

7.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是( )。

A 关联分析  B 分类和预测  C 孤立点分析  D 演变分析  E 概念描述  

正确答案:E 单选题  

8.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?

A 数据清理  B 数据集成  C 数据变换D 数据归约  

正确答案:A 单选题  

9.进行数据规范化的目的是( )。

A 去掉数据中的噪声  B 对数据进行汇总和聚集  

C 使用概念分层,用高层次概念替换低层次“原始”数据  D 将属性按比例缩放,使之落入一个小的特定区间  正确答案:D 单选题  

10.平均值函数avg()属于哪种类型的度量?  

A 分布的  B 代数的  C 整体的  D 混合的  

正确答案:B 单选题  

11.下面哪种分类方法是属于统计学的分类方法?  

A 判定树归纳  B 贝叶斯分类  C 后向传播分类  D 基于案例的推理  

正确答案:B 单选题  

12.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

A 关联分析  B 分类和预测  C 聚类分析D 演变分析  

正确答案:A 单选题  

13.支持度(support)是衡量兴趣度度量( )的指标。  

A 实用性  B 确定性  C 简洁性  D 新颖性  

正确答案:A 单选题  

14.以下哪个范围是数据仓库的数据库规模的一个合理范围?  

A 1-100M  B 100M-10G  C 10-1000G  D 100GB-数TB  

正确答案:D 单选题  

15.下面那种数据挖掘方法可以用来检测孤立点?  

A 概念描述  B 分类和预测  C 聚类分析  D 演变分析  

正确答案:C 单选题  

16.字段Hair_color = {auburn, black, blond, brown, grey, red, white}属于那种属性类型?

A 标称属性  B 二元属性  C 序数属性D 数值属性  

正确答案:A 单选题  

17.下面哪种分类方法是属于神经网络学习算法?  

A 判定树归纳  B 贝叶斯分类  C 后向传播分类  D 基于案例的推理  

正确答案:C 单选题  

18.哪种数据变换的方法将数据沿概念分层向上汇总?

A 平滑  B 聚集  C 数据概化  D 规范化  

正确答案:C 单选题  

19.下面的数据挖掘的任务中,( )将决定所使用的数据挖掘功能。

A 选择任务相关的数据  B 选择要挖掘的知识类型  C 模式的兴趣度度量  D 模式的可视化表示  

正确答案:B 单选题  

20.孤立点挖掘适用于下列哪种场合?

A 目标市场分析  B 购物篮分析  C 模式识别D 信用卡欺诈检测  

正确答案:D 单选题  

21.下面的数据操作中,哪些操作不是多维数据模型上的OLAP操作?  

A 上卷(roll-up)  B 选择(select)  C 切片(slice)  D 转轴(pivot)  

正确答案:B 单选题  

22.下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?

A 空间填充曲线  B 散点图矩阵  C 平行坐标  D 圆弓分割  

正确答案:B 单选题  

23.根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。

A 关联分析  B 分类和预测  C 演变分析  D 概念描述  

正确答案:B 单选题  

24.下列几种数据挖掘功能中,( )被广泛的应用于股票价格走势分析。

A 关联分析  B 分类和预测  C 聚类分析D 演变分析  

正确答案:D 单选题  

25.数据归约的目的是( )。

A 填补数据种的空缺值  B 集成多个数据源的数据  C 得到数据集的压缩表示  D 规范化数据  正确答案:C 单选题  

26.数据的噪声是指( )。

A 孤立点  B 空缺值  

C 测量变量中的随即错误或偏差  D 数据变换引起的错误  

正确答案:C 单选题  

27.存放最低层汇总的方体称为( )。  

A 顶点方体  B 方体的格  C 基本方体  D 维  

正确答案:C 单选题  

28.数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于( )。

A 所涉及的算法的复杂性  B 所涉及的数据量  C 计算结果的表现形式D 是否使用了人工智能技术  

正确答案:B 单选题  

29.以下哪种聚类方法可以发现任意形状的聚类?

A 划分的方法  B 基于模型的方法  C 基于密度的方法  D 层次的方法  

正确答案:C 单选题  

30.帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是( )。

A 关联分析  B 分类和预测  C 聚类分析  D 孤立点分析  E 演变分析  

正确答案:C 单选题  

31.以下哪个指标不是表示对象间的相似度和相异度?

A Euclidean距离  B Manhattan距离  C Eula距离  D Minkowski距离  

正确答案:C 单选题  

32.字段Size = {small, medium, large}属于那种属性类型?

A 标称属性  B 二元属性C 序数属性  D 数值属性  

正确答案:C 单选题  

33.根据关联分析中所处理的值类型,可以将关联规则分类为( )。

A 布尔关联规则和量化关联规则  B 单维关联规则和多维关联规则  C 单层关联规则和多层关联规则  D 简答关联规则和复杂关联规则  

正确答案:A 单选题  

34.( )通过将属性域划分为区间,从而减少给定连续值的个数。  

A 概念分层  B 离散化  C 分箱  D 直方图  

正确答案:B 多选题  

35.OLAP系统和OLTP系统的主要区别包括( )。  

A OLTP系统主要用于管理当前数据,而OLAP系统主要存放的是历史数据  B 在数据的存取上,OLTP系统比OLAP系统有着更多的写操作  

C 对OLTP系统上的数据访问量往往比对OLAP系统的数据访问量要大得多  D OLAP系统中往往存放的是汇总的数据,而OLTP系统中往往存放详细的数据  正确答案:ABD 多选题  

36.Apriori算法所面临的主要的挑战包括( )。  

A 会消耗大量的内存  B 会产生大量的候选项集 C 对候选项集的支持度计算非常繁琐  D 要对数据进行多次扫描  

正确答案:BCD 多选题  

37.下列哪些是数据变换可能涉及的内容?  

A 数据压缩  B 数据概化  C 维归约  D 规范化  

正确答案:BD 多选题  

38.下面哪些问题是我们进行数据预处理的原因?  

A 数据中的空缺值  B 噪声数据  C 数据中的不一致性  D 数据中的概念分层  

正确答案:ABC 多选题  

39.以下哪些是数据仓库的主要应用?  

A 信息处理  B 互联网搜索  C 分析处理  D 数据挖掘  

正确答案:ACD 多选题  

40.根据关联分析中所涉及的数据维,可以将关联规则分类为( )。  

A 布尔关联规则  B 单维关联规则C 多维关联规则  D 多层关联规则  

正确答案:BC 多选题  

41.数据清理的目的是处理数据中的( )。  

A 空缺值  B 噪声数据  C 不一致数据  D 敏感数据  

正确答案:ABC 多选题  

42.从结构的角度看,数据仓库模型包括以下几类( )。  

A 企业仓库  B 数据集市  C 虚拟仓库  D 信息仓库  

正确答案:ABC 多选题  

43.根据关联分析中所涉及的抽象层,可以将关联规则分类为( )。  

A 布尔关联规则  B 单层关联规则  C 多维关联规则  D 多层关联规则  

正确答案:BD 多选题  

44.数据仓库的三层架构主要包括以下哪三部分?  

A 数据源  B 数据仓库服务器C OLAP服务器  D 前端工具  

正确答案:BCD 多选题  

45.以下哪些原因可能引起空缺值?  

A 设备异常  B 命名规则的不一致  

C 与其他已有数据不一致而被删除  

D 在输入时,有些数据因为得不到重视而没有被输入  正确答案:ACD

版权声明

声明:有的资源均来自网络转载,版权归原作者所有,如有侵犯到您的权益 请联系本站我们将配合处理!

分享: