《大数据技术》在线平时作业3-00001
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.在一些问题中,不仅经常需要考察两个变量之间的相关程度,而且还经常需要考察多个变量与多个变量之间即( )之间的相关关系
A.结构分析
B.文本处理
C.分类分析
D.聚类计算
2.随着计算机技术全面和深度地融入社会生活,信息爆炸不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息总量的变化导致了( )——量变引起了质变。( )。
A.数据库的出现
B.信息形态的变化
C.网络技术的发展
D.软件开发技术的进步
3.过滤是自动从项目池中寻找有关项目的过程。项目可以基于用户行为或通过匹配多个用户的行为被过滤。通常过滤的主要方法是( )。
A.完全过滤和不完全过滤
B.数值过滤和字符过滤
C.自动过滤和手动过滤
D.协同过滤和内容过滤
4.基于独立性、可信性、过往成就的纪录、紧迫性和( ),企业倾向于更多地依赖外部顾问进行战略分析。
A.内部数据
B.核心数据
C.外部数据
D.重要数据
5.在现实社会中,我们经常可以看到,成功企业执行上的( )创造了独特的价值主张,形成了可持续的差异化竞争。
A.人才优势
B.资金优势
C.差异优势
D.技术优势
6.A/B测试是指在网站优化的过程中,根据预先定义的标准,提供( )并对其好评程度进行测试的方法。
A.一个版本
B.多个版本
C.一个或多个版本
D.单个测试样本
7.在现代分析活动中,企业力求将推向市场的产品、客户服务和运营过程组合起来创造( )竞争
A.数据仓库再到大数据平台
B.大数据平台到数据仓库
C.大数据平台到数据挖掘
D.数据挖掘到数据仓库
8.所谓“用现有的一般技术难以管理”,例如是指( )。
A.用目前在企业数据库占据主流地位的关系型数据库无法进行管理、具有复杂结构的数据
B.由于数据量的增大,导致对非结构化数据的查询产生了数据丢失
C.分布式处理系统无法承担如此巨大的数据量
D.数据太少无法适应现有的数据库处理条件
9.动物神经系统由数以千万计的互连细胞组成,而对于人类,这个数字达到了( )。
A.数十亿
B.成百上千
C.数亿
D.数十万
10.社交网络的重要成分是实体和( )的关系,因此可以用图来为社交网络建模。
A.网络包含一组实体,这些实体是同一网络中的人
B.网络中的这些活动者完全可以是其他对象
C.基于互联网、电信网等信息承载体,让所有能行使独立功能的普通物体实现互联互通
D.这些活动者之间存在着某种关系,正是这种关系将他们连接在一起
二、多选题 (共 5 道试题,共 25 分)
11.大数据人才整体上需要具备( )等核心知识。
A.数学与统计知识
B.计算机相关知识
C.马克思主义哲学知识
D.市场运营管理知识
E.在特定业务领域的知识
12.HBase构建二级索引的实现方式有哪些?
A.MapReduce
B.Coprocessor
C.Bloom Filter
D.Filter
13.下面哪些概念是HBase框架中使用的?
A.HDFS
B.GridFS
C.Zookeeper
D.EXT3
14.下列关于Bloom Filter的描述正确的是?
A.是一个很长的二进制向量和一系列随机映射函数
B.没有误算率
C.有一定的误算率
D.可以在Bloom Filter中删除元素
15.下列哪个是 Hadoop 运行的模式?
A.单机版
B.伪分布式
C.分布式
三、判断题 (共 5 道试题,共 25 分)
16.Slave 节点要存储数据,所以它的磁盘越大越好。
17.Block Size 是不可以修改的。
18.Nagios 不可以监控 Hadoop 集群,因为它不提供 Hadoop 支持。
19.Hadoop 默认调度器策略为 FIFO.
20.如果 NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作。