《大数据技术》在线平时作业1-00001
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.所谓“( )”,泛指由一个指标的变化导致的其他指标的系统性变化。
A.预测
B.解释
C.预报
D.模拟
2.采用( )方法,可以通过用户之间的联系和用户之间的相似度来判别用户之间的关系强度。
A.社区会员
B.社区核心
C.社区成长
D.社区演化
3.经过数十年发展,分析架构经历了从独立的桌面到企业级( )的一个实质性转变
A.专家
B.英雄
C.领导
D.团队
4.在大数据分析中有很多分析平台可供选择,但下列( )选项不是
A.数据
B.程序
C.系统
D.电脑
5.数据可视化阶段致力于由使用者使用( )技术和工具,并通过图形表示有效的分析结果。
A.如何以及在哪里处理
B.怎样以及什么时候
C.是否以及怎样
D.如何打印以及存储
6.以下说法不正确的是( )
A.Hadoop Streaming使用Unix中的流与程序交互
B.Hadoop Streaming允许我们使用任何可执行脚本语言处理数据流
C.采用脚本语言时必须遵从UNIX的标准输入STDIN,并输出到STDOUT
D.Reduce没有设定,上述命令运行会出现问题
7.分析项目大多数的失败案例都是由于缺少精确定义的( )。
A.发展规模
B.方针政策
C.政治要求
D.业务价值
8.自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,是一门融语言学、计算机科学、数学于一体的科学,其处理过程是( )
A.人类像电脑一样自然地理解世界各国语言的能力
B.人类像电脑一样自然地理解程序设计语言的能力
C.电脑像人类一样自然地理解人类的文字和语言的能力
D.电脑像人类一样自然地理解程序设计语言的能力
9.数据分析学涵盖了对整个数据生命周期的管理,而数据生命周期包含了数据收集、( )、数据组织、数据分析、数据存储以及数据管理等过程。
A.传统统计分析方法和现代统计分析方法
B.传统统计分析方法和计算分析方法
C.现代统计方法和计算分析方法
D.传统计算分析方法和现代计算分析方法
10.Doug Cutting所创立的项目的名称都受到其家人的启发,以下项目不是由他创立的项目是
A.Hadoop
B.Nutch
C.Lucene
D.Solr
二、多选题 (共 5 道试题,共 25 分)
11.下列关于大数据的说法中,错误的是
A.大数据具有体量大、结构单一、时效性强的特征
B.处理大数据需采用新型计算架构和智能算法等新技术
C.大数据的应用注重相关分析而不是因果分析
D.大数据的应用注重因果分析而不是相关分析
E.大数据的目的在于发现新的知识与洞察并进行科学决策
12.HBase官方版本可以安装在什么操作系统上?
A.CentOS
B.Ubuntu
C.RedHat
D.Windows
13.云计算的优势体现在以下哪些方面?
A.云计算服务更加安全可靠
B.云计算可以真正实现按需服务
C.云计算可以有效提高资源利用率
D.云计算可以大大降低成本和能耗
14.下列关于Bloom Filter的描述正确的是?
A.是一个很长的二进制向量和一系列随机映射函数
B.没有误算率
C.有一定的误算率
D.可以在Bloom Filter中删除元素
15.BM公司用3个V来描述大数据的三个基本特征,这3V是()
A.体量
B.规模
C.速度
D.多样性
E.复杂性
三、判断题 (共 5 道试题,共 25 分)
16.Hadoop 支持数据的随机读写。
17.DataNode 首次加入 cluster 的时候,如果 log 中报告不兼容文件版本,那需要 NameNode执行“Hadoop namenode -format”操作格式化磁盘。
18.Nagios 不可以监控 Hadoop 集群,因为它不提供 Hadoop 支持。
19.Secondary namenode就是namenode出现问题时的备用节点
20.集群内每个节点都应该配 RAID,这样避免单磁盘损坏,影响整个节点运行。