序号:1, 题目类型:判断题
题目: 对于一个分类变量的各类别的频数占比,常用柱形图、条形图和饼图来展示。()
选项:
A. √
B. ×
答案:
A. √
序号:2, 题目类型:判断题
题目: 疾病预防和治疗属于大数据在生物医学领域的应用。( )
选项:
A. √
B. ×
答案:
A. √
序号:3, 题目类型:判断题
题目: 样本相关系数(correlation coefficient)可以用于衡量两个变量之间的线性关系强度。( )
选项:
A. √
B. ×
答案:
序号:4, 题目类型:判断题
题目: 批处理系统支持作业执行状态的监控。()
选项:
A. √
B. ×
答案:
序号:5, 题目类型:判断题
题目: NoSQL数据库,如Cassandra和MongoDB,是设计用来处理大量数据的数据库系统。()
选项:
A. √
B. ×
答案:
序号:6, 题目类型:判断题
题目: 数据缺失的现象大量存在而又无法避免。( )
选项:
A. √
B. ×
答案:
序号:7, 题目类型:判断题
题目: 大数据的采集技术已经逐渐成为数据高速增长的主要推动因素之一,成为大数据技术的重要活动。( )
选项:
A. √
B. ×
答案:
序号:8, 题目类型:判断题
题目: 适当地使用数据脱敏技术,可以有效地减少敏感数据在采集、传输、使用等环节中的暴露,降低敏感数据泄露的风险。()
选项:
A. √
B. ×
答案:
序号:9, 题目类型:判断题
题目: 根据数据在收集过程中是否有控制因素,可以将数据分为截面数据和时间序列数据。( )
选项:
A. √
B. ×
答案:
序号:10, 题目类型:判断题
题目: 大数据技术主要处理的数据类型是结构化数据,而对于非结构化数据处理能力较弱。()
选项:
A. √
B. ×
答案:
序号:11, 题目类型:单选题
题目: 下列关于数据预处理的描述中,错误的是( )
选项:
A. 数据预处理是数据挖掘过程中很重要的一步
B. 数据预处理可以提高后续数据分析的准确率
C. 数据预处理中,无论何时数据都需要降维处理
D. 数据预处理包括数据清洗、数据集成等步骤
答案:
序号:12, 题目类型:单选题
题目: 下列各项不属于大数据采集方法的是( )
选项:
A. 系统日志数据采集
B. 逐一观测采集
C. ETL工具采集
D. 网络爬虫
答案:
序号:13, 题目类型:单选题
题目: 以下哪种方法不适用于在线数据集的实时收集()?
选项:
A. 网络爬虫
B. API抓取
C. 问卷调查
D. 流数据捕获
答案:
序号:14, 题目类型:单选题
题目: 在数据仓库的三层架构中,哪一层可以实现数据的快速查询?
选项:
A. 顶层
B. 中间层
C. 底层
D. 不能实现快速查询
答案:
序号:15, 题目类型:单选题
题目: 下列有关SQL数据库的局限性,描述错误的是()
选项:
A. 结构化数据建模
B. 已有数据结构的变化成本高
C. 空间利用率低
D. 无法保证事务处理的可靠性
答案:
序号:16, 题目类型:单选题
题目: 下列各项属于数据仓库的特点的是()
选项:
A. 数据以主题为导向,提供决策支持
B. 数据源单一
C. 数据质量低
D. 不支持历史数据分析
答案:
序号:17, 题目类型:单选题
题目: 下列各项不属于批处理系统的特点的是( )
选项:
A. 可以实现实时的分析报告或自动响应
B. 可以实现无缝扩展以处理峰值数据量或数据请求
C. 支持数据在不同系统之间进行交换
D. 支持作业执行状态的监控
答案:
序号:18, 题目类型:单选题
题目: 在工业网络实时监控系统中,需要连续不断地采集和处理数据。以下( )不属于这种计算模式
选项:
A. 在线处理
B. 实时处理
C. 流式计算
D. 批量计算
答案:
序号:19, 题目类型:单选题
题目: 在大数据分析和处理中,以下哪种算法经常用于进行数据降维?
选项:
A. 决策树算法
B. 贝叶斯算法
C. 随机森林算法
D. 主成分分析算法
答案:
序号:20, 题目类型:单选题
题目: 下列哪项是无监督学习的典型应用?( )
选项:
A. 聚类分析
B. 回归
C. 分类
D. 以上均是
答案:
序号:21, 题目类型:单选题
题目: 下面哪个场景不适合用k近邻法进行分类( )
选项:
A. 良恶性肿瘤预测
B. 天气预报
C. 人脸识别
D. 邮件分类
答案:
序号:22, 题目类型:单选题
题目: 下列哪一项不是大数据处理面临的挑战()
选项:
A. 数据安全和隐私保护
B. 高效实时处理大规模数据
C. 从大量数据中发现有用信息和知识
D. 数据量小导致结果不准确
答案:
序号:23, 题目类型:单选题
题目: 按照数据的结构化程度,我们可将数据分为( )
选项:
A. 截面数据和时间序列数据
B. 一手数据和二手数据
C. 观测数据和实验数据
D. 结构化数据、半结构化数据和非结构化数据
答案:
序号:24, 题目类型:单选题
题目: 下列关于非结构化数据的描述,哪一项是错误的()
选项:
A. 非结构化数据没有固定的数据模型
B. 非结构化数据包括图像、声音、视频等
C. 非结构化数据不可以进行数据分析
D. 非结构化数据数量大
答案:
序号:25, 题目类型:单选题
题目: 下列哪项并非大数据在电商领域的应用?
选项:
A. 客户画像
B. 仓储管理
C. 精准营销
D. 生态保护
答案:
序号:26, 题目类型:单选题
题目: 在数据可视化中,适合表示数据随时间变化的趋势的是( )
选项:
A. 散点图
B. 折线图
C. 柱形图
D. 饼图
答案:
序号:27, 题目类型:单选题
题目: 关于数据可视化的描述中,哪一项是错误的()
选项:
A. 数据可视化的目的是使数据更易理解
B. 数据可视化只能用于表示定量数据
C. 数据可视化可以帮助我们发现数据中的模式
D. 数据可视化可以帮助我们进行更好的决策
答案:
序号:28, 题目类型:单选题
题目: 以下可视化图形中,( )是由数据集合中的最大值、最小值、中位数和两个四分位数绘制而成
选项:
A. 柱形图
B. 饼图
C. 箱线图
D. 直方图
答案:
序号:29, 题目类型:单选题
题目: 在大数据处理中,用以确保数据完整性、防止被非法篡改的安全技术是( )
选项:
A. 数据匿名化
B. 数据脱敏
C. 数据水印技术
D. 数据加密
答案:
序号:30, 题目类型:单选题
题目: 在大数据中,以下哪项可能导致个人信息被泄露?
选项:
A. 数据发布的匿名技术
B. 数据脱敏过于彻底
C. 不完善的隐私保护政策
D. 数据线性规划
答案:
序号:31, 题目类型:问答题
题目: 请说明什么是数据降维,在大数据处理中,其作用是什么?
选项:
答案:
序号:32, 题目类型:问答题
题目: 请解释什么是分类方法,什么是训练集和检验集,并给出一些常见的分类算法。
选项:
答案:
序号:33, 题目类型:问答题
题目: 请列举三种大数据在教育领域的应用。
选项:
答案:
序号:34, 题目类型:问答题
题目: 大数据在应用中主要面临哪些挑战?
选项:
答案: