大数据概论(专)
学校: 无
问题 1: 1. 关于聚类挖掘,表述错误的是:
选项:
A. 聚类结果的好坏取决于相似性的度量方法以及具体实现
B. 好聚类的方法的标准是要产生高质量的聚类结果
C. 聚类结果的好坏与能否发现隐含模式无关
D. 好的聚类结果应该有高类内相似性和低类间相似性这样的特征
答案: 聚类结果的好坏与能否发现隐含模式无关
问题 2: 2. 什么是存储在计算机内有结构的数据的集合?
选项:
A. 数据库管理系统
B. 数据库系统
C. 数据库结构
D. 数据库
答案: 数据库
问题 3: 3. 哪个不属于知识发现的步骤
选项:
A. 数据选择
B. 数据集成
C. 数据清理
D. 数据开发
答案: 数据开发
问题 4: 4. 不属于社交网络特点的是
选项:
A. 海量用户
B. 实时数据
C. 数据单一
D. 完整数据
答案: 数据单一
问题 5: 5. 单舆情的系统架构正确的是
选项:
A. 规划-存储-分析-采集-报告-管控
B. 规划-采集-分析-存储-报告-管控
C. 规划-存储-采集-分析-报告-管控
D. 规划-采集-存储-分析-报告-管控
答案: 规划-采集-存储-分析-报告-管控
问题 6: 6. 以下不属于网络舆情的主要来源的是
选项:
A. QQ
B. 论坛与BBS
C. 书信
D. 微信
答案: 书信
问题 7: 7. 大数据可能带来(),但未必能够带来()
选项:
A. 多样性;准确度
B. 精确度;多样性
C. 准确度;精确度
D. 精确度;准确度
答案:
问题 8: 8. 数据清洗的方法不包括( )。
选项:
A. 缺失值处理
B. 重复数据记录处理
C. 噪声数据清除
D. 一致性检查
答案:
问题 9: 9. 计量单位从低到高,下面的说法正确的是( )
选项:
A. KB< MB< GB< TB
B. EB< KB< MB< TB
C. GB< KB< MB< TB
D. EB< MB< GB< TB
答案:
问题 10: 10. 智能健康手环的应用开发,体现了( )的数据采集技术的应用
选项:
A. 传感器
B. API接口
C. 网络爬虫
D. 统计报表
答案:
问题 11: 11. 属于高质量聚类分析的要求:①可扩展性 ②处理相同类型数据的能力 ③发现任意形状的能力 ④领域知识参数输入的最大化 ⑤处理噪声数据的能力 ⑥数据输入顺序敏感
选项:
A. ①②③④⑤⑥
B. ①③⑥
C. ①③⑤
D. ②④⑥
答案:
问题 12: 12. 社群结构聚合探测算法的步骤中,()条件满足时,算法会停止并输出探测结果。
选项:
A. maxφpq≤0
B. 0
C. maxφpq
D. maxφpq≥0
E. maxφpq<0
答案:
问题 13: 13. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
选项:
答案:
问题 14: 14. 网球比赛,与其他体育项目一样,涉及大量数据。
选项:
答案:
问题 15: 15. 谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。
选项:
答案:
问题 16: 16. 传统数据密集型行业积极探索和布局大数据应用的表现是( )。
选项:
A. 自行开发数据产品
B. 投资入股互联网电商行业
C. 提高分析挖掘能力
D. 打通多源跨域数据
E. 实现科学决策与运营
答案:
问题 17: 17. 中国电信把自己的大数据开发分为:
选项:
A. 媒体类应用
B. 广告类应用
C. 服务类应用
D. 商品类应用
答案:
问题 18: 18. 根据麦肯锡的预测,随着大数据的普及,全球零售业和医疗行业的利润将会减少。
选项:
答案:
问题 19: 19. 宁家骏委员指出,发展大数据的应用,有助于促进医疗改革。
选项:
答案:
问题 20: 20. 大数据的数据类型包括网络日志、音频、视频、图片、地理位置信息等等。 ()
选项:
答案:
问题 21: 21. 大数据的起始计量单位至少是 MB。()
选项:
答案:
问题 22: 22. 在没有大数据的条件下,人才的发现与选拔都很难做到"全信息”,大数据能够帮助人们解决这个问题。
选项:
答案:
问题 23: 23. 大数据的应用之一是,促进健康管理的个性化和多元化。
选项:
答案:
问题 24: 24. 由于历史的原因,我国医院的信息化建设层次不齐、水平不一。
选项:
答案:
问题 25: 25. 以下说法错误的是
选项:
A. 关联规则在使用时的两个指标是支持度和置信度
B. FP-树频集算法是针对Apriori算法缺点进行改进后的算法
C. APRIORI算法最大的缺点是复杂度太高
D. FP-树频集算法虽然克服了Apriori算法复杂度的问题,但是获得的结果却是不靠谱的
答案:
问题 26: 26. 关联规则的基本概念中错误的是
选项:
A. 置信度是项集出现次数除以总的交易次数
B. 项集频率指的是项集所有交易中出现的次数
C. K项集指的是K个项的集合
D. 相对支持度指的是项集出现次数除以总的交易次数
答案:
问题 27: 27. K均值算法的缺点():①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量
选项:
A. ①③
B. ①②③④⑤
C. ①③⑤
D. ②④
答案:
问题 28: 28. 什么是大数据使用的最可靠方法?
选项:
A. 大数据与样本数据结合
B. 样本数据源
C. 大数据源
D. 规模大
答案:
问题 29: 29. 下列关于数据重组的说法中,错误的是( )。
选项:
A. 数据重组是数据的重新生产和重新采集
B. 数据重组实现的关键在于多源数据融合和数据集成
C. 数据重组能够使数据焕发新的光芒
D. 数据重组有利于实现新颖的数据模式创新
答案:
问题 30: 30. 大数据的最显著特征是( )。
选项:
A. 数据类型多样
B. 数据价值密度高
C. 数据处理速度快
D. 数据规模大
答案:
问题 31: 31. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。
选项:
A. 在数据规模上强调相对数据而不是绝对数据
B. 在分析效果上更追究效率而不是绝对精确
C. 在数据基础上倾向于全体数据而不是抽样数据
D. 在分析方法上更注重相关分析而不是因果分析
答案:
问题 32: 32. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )。
选项:
A. 数据规模大
B. 数据类型多样
C. 数据处理速度快
D. 数据价值密度高
答案:
问题 33: 33. 单选 Hive的数据计算使用
选项:
A. HBASE
B. HDFS
C. PIG
D. MapReduce
答案:
问题 34: 34. 单选 Hadoop生态系统中,最核心的设计是()
选项:
A. HDFS和MAPREDUCE
B. HIVE和HDFS
C. HBASE和STORM
D. TEZ和PIG
答案:
问题 35: 35. 单选 Web挖掘中内容挖掘的基本技术是()
选项:
A. 图片挖掘
B. 文本挖掘
C. 数据挖掘
D. 技术挖掘
答案:
问题 36: 36. 布尔权重是指如果某个词条在一篇文本中出现,则将其权值定义为(),否则定义为()
选项:
A. 2,0
B. 0,2
C. 1,0
D. 0,1
答案:
问题 37: 37. 以下哪个不是推荐系统的评测指标
选项:
A. 新颖性
B. 统一性
C. 惊喜度
D. 覆盖率
答案:
问题 38: 38. 分类变量使用( )建立预测模型。
选项:
A. 离散树
B. 决策树
C. 分类树
D. 回归树
答案:
问题 39: 39. 对线下零售而言,做好大数据分析应用的前提是( )
选项:
A. 扩大营业面积
B. 增加数据来源
C. 增加统计种类
D. 开展优惠促销
答案:
问题 40: 40. 万维网的实施国家是( )
选项:
A. 德国
B. 英国
C. 印度
D. 美国
答案:
问题 41: 41. 一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维维度中的( )
选项:
A. 实验思维
B. 相关思维
C. 定量思维
D. 因果思维
答案:
问题 42: 42. 下列关于网络用户行为的说法中,错误的是( )。
选项:
A. 用户的隐私安全很难得以规范保护
B. 数字轨迹用完即自动删除
C. 网络公司能够捕捉到用户在其网站上的所有行为
D. 用户离散的交互痕迹能够为企业提升服务质量提供参考
答案:
问题 43: 43. 以下说法正确的是
选项:
A. Spark只能基于HDFS这样分布式文件存储系统
B. Spark可以基于HDFS这样分布式文件存储系统也可以基于Tachyon这样基于内存分布式文件存储系统
C. Spark只能基于Tachyon这样基于内存分布式文件存储系统
D. Spark既无法基于HDFS这样分布式文件存储系统也无法基于Tachyon这样基于内存分布式文件存储系统
答案:
问题 44: 44. 能同时进行交互式计算,批处理,流式计算的计算框架为
选项:
A. Storm
B. Impala
C. Spark
D. Shark
答案:
问题 45: 45. Storm属于()计算
选项:
A. 流式
B. 批处理
C. 交互式
D. 云
答案:
问题 46: 46. Spark生态图中,()提供了图存储结构和常见的图算法
选项:
A. GraphxGraphParallel
B. Tachyon
C. SharkSQL
D. SparkStreaming
答案:
问题 47: 47. 中国互联网购物者占互联网使用者的比例为:
选项:
A. 0.56
B. 0.55
C. 0.57
D. 0.5
答案:
问题 48: 48. RDD中进行map,filter,groupBy等操作属于()
选项:
A. Acter
B. Change
C. Active
D. Transformation
答案:
问题 49: 49. 大数据时代,数据使用的关键是( )。
选项:
A. 数据存储
B. 数据收集
C. 数据分析
D. 数据再利用
答案:
问题 50: 50. 下列关于数据交易市场的说法中,错误的是( )。
选项:
A. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助
B. 数据交易市场是大数据产业发展到一定程度的产物
C. 商业化的数据交易活动催生了多方参与的第三方数据交易市场
D. 数据交易市场是大数据资源化的必然产物
答案:
问题 51: 51. 数据仓库的最终目的是( )。
选项:
A. 建立数据仓库逻辑模型
B. 收集业务需求
C. 为用户和业务部门提供决策支持
D. 开发数据仓库的应用分析
答案:
问题 52: 52. K均值算法的缺点()①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量
选项:
A. ①③⑤
B. ①②③④⑤
C. ②④
D. ①③
答案:
问题 53: 53. 关于内容深度理解建立索引说法正确的是
选项:
A. 客观索引与文档内容有关
B. 内容索引与客观因素有很大关系
C. 内容索引又可以分为单索引和双索引
D. 索引分为客观索引和主观索引
答案:
问题 54: 54. 中国的网络消费者比线下消费者更( )。
选项:
A. 年轻和富裕
B. 年老和贫困
C. 年轻和贫困
D. 年老和富裕
答案:
问题 55: 55. 大数据获取的个人信息比传统调研获得的个人信息真实性( )。
选项:
A. 更低
B. 相同
C. 不确定
D. 更高
答案:
问题 56: 56. DMP分为( )和( )。
选项:
A. 单一式DMP;多元式DMP
B. 开放式DMP;私有式DMP
C. 单一式DMP;封闭式DMP
D. 开放式DMP;封闭式DMP
答案:
问题 57: 57. 阿里巴巴旗下的数据管理平台,被称为:
选项:
A. 蚂蚁花呗
B. 达摩盘
C. 招财宝
D. 支付宝
答案:
问题 58: 58. 万维网之父是( )。
选项:
A. 蒂姆•伯纳斯-李
B. 舍恩伯格
C. 彼得•德鲁克
D. 斯科特•布朗
答案:
问题 59: 59. Mac OS系统的开发者是()。
选项:
A. 苹果公司
B. 微软公司
C. 惠普公司
D. IBM公司
答案:
问题 60: 60. 下列论据中,能够支撑"大数据无所不能”的观点的是( )。
选项:
A. 个人隐私泄露与信息安全担忧
B. 大数据具有非常高的成本
C. 互联网金融打破了传统的观念和行为
D. 大数据存在泡沫
答案:
问题 61: 61. Spark生态图中,()提供了一个机器学习的算法库
选项:
A. GraphxGraphParallel
B. Tachyon
C. MLBaseMachineLearning
D. SharkSQL
答案:
问题 62: 62. ()充分利用了MapReduce和HDFS的扩展性和容错性,是基于MapReduce开发的数据挖掘,机器学习库
选项:
A. MaHout
B. YARN
C. MAPREDUCE
D. STORM
答案:
问题 63: 63. 特征抽取常用算法的互信息,互信息值()表示词条和类别的共现程度()
选项:
A. 越大,越大
B. 越小,越小
C. 越大,越小
D. 越小,越大
答案:
问题 64: 64. RDD中进行count,collect,save等操作属于()
选项:
A. Active
B. Transformation
C. Change
D. Acter
答案:
问题 65: 65. 根据PageRank算法的基本思想,以下哪种情况说明了页面的重要性
选项:
A. 页面的重要性无法传递
B. 被多次引用的页面
C. 被非重要的页面引用的页面
D. 没有被多次引用的页面
答案:
问题 66: 66. Web应用挖掘中最有效而且简单的分析方法是
选项:
A. 点击流分析
B. 内容分析
C. 结构分析
D. 数据挖掘
答案:
问题 67: 67. Hadoop生态系统中,集群的资源管理系统是()
选项:
A. MAPREDUCE
B. YARN
C. STORM
D. HDFS
答案:
问题 68: 68. Hadoop提供的MapReduce的编程方式中,()是最原始的方式
选项:
A. HadoopStreaming
B. Java
C. PHP
D. HadoopPipes
答案:
问题 69: 69. 大数据的起源是( )
选项:
A. 金融
B. 电信
C. 公共管理
D. 互联网
答案:
问题 70: 70. 智慧城市的智慧之源是( )
选项:
A. 物联网
B. 云计算
C. 大数据
D. 数字城市
答案:
问题 71: 71. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是( )关系,而吸烟和肺癌则是()关系
选项:
A. 相关因果
B. 因果相关
C. 因果并列
D. 并列相关
答案:
问题 72: 72. 传统大数据质量清洗的特点有:
选项:
A. 协调式的
B. 确定性
C. 强类型性
D. 非确定性
答案:
问题 73: 73. 以下选项中属于数据的作用的是( )。
选项:
A. 欣赏
B. 建立信心
C. 验证假设
D. 沟通
答案:
问题 74: 74. 慈铭体检机构的 O2O健康管理产品,由( )组成。
选项:
A. 智能运动手腕
B. 手机APP
C. 健康管理云平台
D. 保健品
答案:
问题 75: 75. 当前大数据技术的基础包括( )
选项:
A. 关系型数据库
B. 分布式数据库
C. 分布式文件系统
D. 分布式并行计算
答案:
问题 76: 76. 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面作( )
选项:
A. 提供高性能并行计算技术的强力支撑
B. 能够静态演化事物的变化及变化的规律
C. 能够直观反映成对数据之间的空间关系
D. 能够直观反映多维数据之间的空间关系
E. 能够动态演化事物的变化及变化的规律
答案:
问题 77: 77. 下列关于计算机存储容量单位换算关系的公式中,正确的是( )
选项:
A. 1GB=1024KB
B. 1KB=1024Byte
C. 1KB=1012Byte
D. 1GB=1012KB
E. 1GB=1024MB
答案:
问题 78: 78. 避免"数据孤岛”的方法包括:
选项:
A. 数据融合
B. 数据输入
C. 利用样本框
D. 关键匹配变量
答案:
问题 79: 79. 以下属于机器学习的是:
选项:
A. 监督式学习
B. 半监督式学习
C. 非监督式学习
D. 强化学习
答案:
问题 80: 80. 机器学习的四大类分析技术的主要算法包括()
选项:
A. 描述性统计
B. 聚类分析
C. 分类与预测
D. 关联分析
答案:
问题 81: 81. 大数据作为一种数据集合,当我们使用这个概念的时候,实际包含有哪几层含义?
选项:
A. 变化很快
B. 数据很大
C. 构成复杂
D. 蕴含大价值
答案:
问题 82: 82. 用户建模模块的功能是
选项:
A. 存储或者修改用户的兴趣偏好
B. 获取、表示用户的兴趣偏好
C. 帮助用户找到需要的东西
D. 对用户进行识别和分类
答案:
问题 83: 83. 下列关于脏数据的说法中,正确的是( )。
选项:
A. 编码不统一
B. 意义不明确
C. 格式不规范
D. 数据不完整
E. 与实际业务关系不大
答案:
问题 84: 84. 2012年"中央1号文件”提出,要全面推进农业农村信息化,着力提高()的信息服务水平。
选项:
A. 文化交流
B. 质量安全控制
C. 农业生产经营
D. 市场流通
答案:
问题 85: 1. 当前社会中,最为突出的大数据环境是( )
选项:
A. 自然资源
B. 互联网
C. 物联网
D. 综合国力
答案:
问题 86: 2. 可以对大数据进行深度分析的平台工具是( )
选项:
A. 未来机器学习工具
B. 第二代机器学习工具
C. 传统的机器学习和数据分析肛具
D. 第二代机器学习工具
答案:
问题 87: 3. 根据周琦老师所讲,高德交通信息服务覆盖全国高速()以上。
选项:
A. 70%
B. 50%
C. 90%
D. 60%
答案:
问题 88: 4. 根据周琦老师所讲,以下哪项不属于数据挖掘的内容?
选项:
A. 高德地图导航有躲避拥堵功能
B. 建立道路拥堵概率与拥堵趋势变化模型
C. 补充与完善路网属性
D. 多维分析统计用户出行规律
答案:
问题 89: 5. 2012年全国各城市支付宝人均支出排名中,位居第二位的是()
选项:
A. 高雄市
B. 嘉义市
C. 嘉兴市
D. 杭州市
答案:
问题 90: 6. 第一个提出大数据概念的公司是 ( )。
选项:
A. 微软公司
B. 谷歌公司
C. 脸谱公司
D. 麦肯锡公司
答案:
问题 91: 7. 关于大数据在社会综合治理中的作用,以下理解不正确的是( )。
选项:
A. 大数据的运用有利于走群众路线
B. 大数据的运用能够加强交通管理
C. 大数据的运用能够维护社会治安
D. 大数据的运用能够杜绝抗生素的滥用
答案:
问题 92: 8. 关于推荐系统的说法错误的是
选项:
A. 推荐系统经历了很短的时间形成
B. 推荐系统的相关技术包括机器学习及数据挖掘算法等
C. 推荐系统的架构为离线计算-在线计算-推荐引擎APP
D. 推荐系统的常见表现形式有猜你喜欢、买了又买、精品推荐等
答案:
问题 93: 9. 以下关于搜索引擎说法错误的是
选项:
A. 呈现的搜索结果是凌乱无序的
B. 是基于web相关技术为基础的
C. 是能依据用户需求查找相应信息的在线搜索系统
D. 是对网络信息资源进行抓取和采集建立索引数据库
答案:
问题 94: 10. 大数据可能带来( ),但未必能够带来( )。
选项:
A. 精确度;多样性
B. 精确度;准确度
C. 多样性;准确度
D. 准确度;精确度
答案:
问题 95: 11. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( )。
选项:
A. 软件开发工程师
B. 研究科学家
C. 数据分析员
D. 数据管理人员
答案:
问题 96: 12. 智能健康手环的应用开发,体现了( )的数据采集技术的应用。
选项:
A. API接口
B. 统计报表
C. 网络爬虫
D. 传感器
答案:
问题 97: 13. 以下选项中,不属于信息时代的定律的是( )。
选项:
A. 摩尔定律
B. 吉尔德定律
C. 达律多定律
D. 麦特卡尔夫定律
答案:
问题 98: 14. 关于聚类挖掘,表述错误的是:
选项:
A. 聚类结果的好坏与能否发现隐含模式无关
B. 聚类结果的好坏取决于相似性的度量方法以及具体实现
C. 好的聚类结果应该有高类内相似性和低类间相似性这样的特征
D. 好聚类的方法的标准是要产生高质量的聚类结果
答案:
问题 99: 15. 什么是存储在计算机内有结构的数据的集合?
选项:
A. 数据库
B. 数据库管理系统
C. 数据库系统
D. 数据库结构
答案:
问题 100: 16. 哪个不属于知识发现的步骤
选项:
A. 数据选择
B. 数据清理
C. 数据开发
D. 数据集成
答案:
问题 101: 17. 不属于社交网络特点的是
选项:
A. 完整数据
B. 海量用户
C. 数据单一
D. 实时数据
答案:
问题 102: 18. 单舆情的系统架构正确的是
选项:
A. 规划-采集-存储-分析-报告-管控
B. 规划-采集-分析-存储-报告-管控
C. 规划-存储-分析-采集-报告-管控
D. 规划-存储-采集-分析-报告-管控
答案:
问题 103: 19. 以下不属于网络舆情的主要来源的是
选项:
A. 论坛与BBS
B. QQ
C. 微信
D. 书信
答案:
问题 104: 20. 数据清洗的方法不包括( )。
选项:
A. 缺失值处理
B. 重复数据记录处理
C. 一致性检查
D. 噪声数据清除
答案:
问题 105: 21. 智能健康手环的应用开发,体现了( )的数据采集技术的应用
选项:
A. 网络爬虫
B. 统计报表
C. 传感器
D. API接口
答案:
问题 106: 22. 支撑大数据业务的基础是( )
选项:
A. 数据人才
B. 数据硬件
C. 数据应用
D. 数据科学
答案:
问题 107: 23. 面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是( )
选项:
A. 大数据信息分类模式
B. 大数据解决方案模式
C. 大数据处理服务模式
D. 大数据资源提供模式
答案:
问题 108: 24. 当前大数据技术的基础是由( )首先提出的。
选项:
A. 谷歌
B. 阿里巴巴
C. 百度
D. 微软
答案:
问题 109: 25. 大数据的起源是( )。
选项:
A. 公共管理
B. 金融
C. 互联网
D. 电信
答案:
问题 110: 26. ( )反映数据的精细化程度,越细化的数据,价值越高。
选项:
A. 活性
B. 规模
C. 颗粒度
D. 关联度
答案:
问题 111: 1. 在网络爬虫的爬行策略中,应用最为基础的是( )。
选项:
A. 大站优先策略
B. 深度优先遍历策略
C. 反向链接策略
D. 广度优先遍历策略
E. 高度优先遍历策略
答案:
问题 112: 2. 当前,大数据产业发展的特点是( )。
选项:
A. 增速很快
B. 多产业交叉融合
C. 规模较大
D. 规模较小
E. 增速缓慢
答案:
问题 113: 3. 下列关于数据生命周期管理的核心认识中,正确的是( )。
选项:
A. 根据数据价值的不同应该对数据采取不同的管理策略
B. 在不同的数据存在阶段,数据的价值是不同的
C. 数据生命周期管理旨在产生效益的同时,降低生产成本
D. 数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段
E. 数据生命周期管理最终关注的是社会效益
答案:
问题 114: 4. 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( )。
选项:
A. 传统营销模式比基于大数据的营销模式针对性更强
B. 基于大数据的营销模式比传统营销模式精准性更强
C. 传统营销模式比基于大数据的营销模式投入更小
D. 基于大数据的营销模式比传统营销模式实时性更强
E. 传统营销模式比基于大数据的营销模式转化率低
答案:
问题 115: 5. 按照涉及自变量的多少,可以将回归分析分为( )。
选项:
A. 非线性回归分析
B. 一元回归分析
C. 多元回归分析
D. 线性回归分析
E. 综合回归分析
答案:
问题 116: 6. 传统数据密集型行业积极探索和布局大数据应用的表现是( )。
选项:
A. 自行开发数据产品
B. 实现科学决策与运营
C. 打通多源跨域数据
D. 提高分析挖掘能力
E. 投资入股互联网电商行业
答案:
问题 117: 7. 下列关于大数据的说法中,错误的是( )。
选项:
A. 大数据的目的在于发现新的知识与洞察并进行科学决策
B. 大数据的应用注重因果分析而不是相关分析
C. 大数据的应用注重相关分析而不是因果分析
D. 大数据具有体量大、结构单一、时效性强的特征
E. 处理大数据需采用新型计算架构和智能算法等新技术
答案:
问题 118: 8. 数据建立信心的作用需具备的条件包括( )。
选项:
A. 信得过的第三方单位
B. 多方的数据源
C. 可靠数据源
D. 合适的数据分析
答案:
问题 119: 9. 数据只有在与( )的交互中才能发挥作用。
选项:
A. 物
B. 企业
C. 人
D. 消费者
答案:
问题 120: 10. 大数据的定义是:
选项:
A. 技术
B. 商业
C. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合
D. 任何超过了一台计算机处理能力的数据量
答案:
问题 121: 11. 大数据五大类应用方向是:
选项:
A. 预测
B. 统计
C. 预警
D. 查询
E. 触达
答案:
问题 122: 12. 以下属于推荐系统算法的是
选项:
A. 基于知识推理算法
B. 关联规则算法
C. 聚类及相似度算法
D. CF协同过滤算法
答案:
问题 123: 13. 传统大数据质量清洗的特点有:
选项:
A. 协调式的
B. 非确定性
C. 确定性
D. 强类型性
答案:
问题 124: 14. 以下选项中属于数据的作用的是( )。
选项:
A. 沟通
B. 建立信心
C. 验证假设
D. 欣赏
答案:
问题 125: 1. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。
选项:
答案:
问题 126: 2. "大数据”一词,最早出现于20世纪90年代,当时的数据仓库之父比尔.恩门经常提及Big Data。
选项:
答案:
问题 127: 3. 宁家骏委员指出,我国民生领域信息化服务水平显著提升。
选项:
答案:
问题 128: 4. 1997年,1GB闪存的价格将近8000美元,现在是25美分。
选项:
答案:
问题 129: 5. 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响, 从而说服决策者信服并采纳其建议, 是数据分析能力对大数据人才的基本要求。
选项:
答案:
问题 130: 6. 简单随机抽样,是从总体 N个对象中任意抽取 n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。
选项:
答案:
问题 131: 7. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
选项:
答案:
问题 132: 8. 根据麦肯锡的预测,随着大数据的普及,全球零售业和医疗行业的利润将会减少。
选项:
答案:
问题 133: 9. 宁家骏委员指出,发展大数据的应用,有助于促进医疗改革。
选项:
答案:
问题 134: 1. 属于高质量聚类分析的要求:①可扩展性 ②处理相同类型数据的能力 ③发现任意形状的能力 ④领域知识参数输入的最大化 ⑤处理噪声数据的能力 ⑥数据输入顺序敏感
选项:
A. ①③⑥
B. ①③⑤
C. ②④⑥
D. ①②③④⑤⑥
答案:
问题 135: 2. 社群结构聚合探测算法的步骤中,()条件满足时,算法会停止并输出探测结果。
选项:
A. maxφpq
B. maxφpq<0
C. maxφpq≥0
D. 0
E. maxφpq≤0
答案:
问题 136: 3. 以下说法错误的是
选项:
A. FP-树频集算法是针对Apriori算法缺点进行改进后的算法
B. 关联规则在使用时的两个指标是支持度和置信度
C. APRIORI算法最大的缺点是复杂度太高
D. FP-树频集算法虽然克服了Apriori算法复杂度的问题,但是获得的结果却是不靠谱的
答案:
问题 137: 4. 关联规则的基本概念中错误的是
选项:
A. 置信度是项集出现次数除以总的交易次数
B. 相对支持度指的是项集出现次数除以总的交易次数
C. 项集频率指的是项集所有交易中出现的次数
D. K项集指的是K个项的集合
答案:
问题 138: 5. K均值算法的缺点():①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量
选项:
A. ②④
B. ①②③④⑤
C. ①③⑤
D. ①③
答案:
问题 139: 6. 什么是大数据使用的最可靠方法?
选项:
A. 规模大
B. 大数据源
C. 大数据与样本数据结合
D. 样本数据源
答案:
问题 140: 7. 下列关于数据重组的说法中,错误的是( )。
选项:
A. 数据重组实现的关键在于多源数据融合和数据集成
B. 数据重组是数据的重新生产和重新采集
C. 数据重组能够使数据焕发新的光芒
D. 数据重组有利于实现新颖的数据模式创新
答案:
问题 141: 8. 大数据的最显著特征是( )。
选项:
A. 数据处理速度快
B. 数据类型多样
C. 数据价值密度高
D. 数据规模大
答案:
问题 142: 9. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。
选项:
A. 在分析效果上更追究效率而不是绝对精确
B. 在数据基础上倾向于全体数据而不是抽样数据
C. 在数据规模上强调相对数据而不是绝对数据
D. 在分析方法上更注重相关分析而不是因果分析
答案:
问题 143: 10. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )。
选项:
A. 数据规模大
B. 数据价值密度高
C. 数据类型多样
D. 数据处理速度快
答案:
问题 144: 11. 当前社会中,最为突出的大数据环境是( )。
选项:
A. 物联网
B. 自然资源
C. 综合国力
D. 互联网
答案:
问题 145: 12. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种( )
选项:
A. 研究科学家
B. 数据分析员
C. 软件开发工程师
D. 数据管理人员
答案:
问题 146: 13. 下列论据中,能够支撑"大数据无所不能”的观点的是( )
选项:
A. 大数据具有非常高的成本
B. 互联网金融打破了传统的观念和行为
C. 大数据存在泡沫
D. 个人隐私泄露与信息安全担忧
答案:
问题 147: 14. 下列国家的大数据发展行动中,支持原则先行、谨慎发展的国家( )
选项:
A. 英国
B. 澳大利亚
C. 韩国
D. 印度
答案:
问题 148: 15. 医疗健康数据的基本情况不包括以下哪项?
选项:
A. 公共安全数据
B. 健康档案数据
C. 个人健康管理数据
D. 诊疗数据
答案:
问题 149: 16. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大网点,这体现了大数据分析理念中的( )
选项:
A. 在分析方法上更注重相关分析而不是因果分析
B. 在数据基础上倾向于全体数据而不是抽样数据
C. 在数据规模上强调相对数据而不是绝对数据
D. 在分析效果上更追求效率而不是绝对精确
答案:
问题 150: 17. 数据仓库的最终目的是( )
选项:
A. 开发数据的应用分析
B. 为用户和业务部门提供决策支持
C. 收集业务需求
D. 建立数据仓库逻辑模型
答案:
问题 151: 18. 大数据的最显著特征是( )
选项:
A. 数据类型多样
B. 数据规模大
答案:
问题 152: 19. 智慧城市的构建,不包含( )。
选项:
A. 数字城市
B. 物联网
C. 联网监控
D. 云计算
答案:
问题 153: 20. 根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国10万公里15万处更新。
选项:
A. 2014年
B. 2006年
C. 2008年
D. 2010年
答案:
问题 154: 21. 第一个提出大数据概念的公司是
选项:
A. 麦肯锡公司
B. 脸谱公司
C. 谷歌公司
D. 微软公司
答案:
问题 155: 22. 以下选项中,不属于大数据对人才能力的要求是
选项:
A. IT技术能力
B. 逻辑思维能力
C. 数学统计能力
D. 业务能力
答案:
问题 156: 23. 根据周琦老师所讲,高德交通报告针对全国()个城市交通状态进行挖掘分析。
选项:
A. 21
B. 30
C. 25
D. 38
答案:
问题 157: 24. 以下选项中,不属于大数据对人才能力的要求是( )。
选项:
A. IT技术能力
B. 业务能力
C. 数学统计能力
D. 逻辑思维能力
答案:
问题 158: 25. Web2.0强调()。
选项:
A. 网站
B. 单位
C. 个人
D. 机构
答案:
问题 159: 26. 根据周琦老师所讲,高德交通日均采集数十亿定位请求,系统处理月均()公里驾驶里程覆盖。
选项:
A. 100亿
B. 80亿
C. 50亿
D. 150亿
答案:
问题 160: 27. 大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()。
选项:
A. 新一代信息技术
B. 新一代服务业态
C. 新一代技术平台
D. 新一代信息技术和服务业态
答案:
问题 161: 28. 大数据整合要保证各个数据源之间的( )。
选项:
A. 差异性、协调性
B. 一致性、协调性
C. 一致性、差异性
D. 一致性、相容性
答案:
问题 162: 1. 当前大数据技术的基础包括( )
选项:
A. 分布式并行计算
B. 分布式数据库
C. 关系型数据库
D. 分布式文件系统
答案:
问题 163: 2. 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面作( )
选项:
A. 能够直观反映多维数据之间的空间关系
B. 能够静态演化事物的变化及变化的规律
C. 提供高性能并行计算技术的强力支撑
D. 能够动态演化事物的变化及变化的规律
E. 能够直观反映成对数据之间的空间关系
答案:
问题 164: 3. 下列关于计算机存储容量单位换算关系的公式中,正确的是( )
选项:
A. 1KB
B. 1024KB
C. 1GB
D. 1GB
E. 1024Byte
F. 1012Byte
G. 1KB
H. 1GB
I. 1024MB
J. 1012KB
答案:
问题 165: 4. 下列各国大数据发展路径的描述中,对应关系正确的是( )
选项:
A. 英国:视大数据为新的自然资源
B. 韩国:重视基础、首都先行
C. 印度:以IT外包转型为突破口若悬河
D. 澳大利亚:原则先行、谨慎发展
E. 日本:走尖端IT路线
答案:
问题 166: 5. 当前,大数据产业发展的特点是( )
选项:
A. 规模较大
B. 规模较小
C. 增速缓慢
D. 多产业交叉融合
E. 增速很快
答案:
问题 167: 6. 按照服务目的不同,数据流通平台可分为( )
选项:
A. 数据交易市场
B. 政府数据开放平台
C. 数据研发市场
D. 企业数据开放平台
E. 数据废气交易市场
答案:
问题 168: 7. 大数据的价值体现在( )
选项:
A. 大数据为政策制定提供科学论据
B. 大数据实现了精准营销
C. 大数据给思维方式带来了冲击
D. 大数据助力智慧城市提升公共服务水平
E. 大数据的发力点在于预测
答案:
问题 169: 8. 大数据有哪些价值?
选项:
A. 生产数据的价值
B. 实时价值
C. 描述价值
D. 用户身份识别
E. 预测价值
答案:
问题 170: 9. 大数据的预测价值体现在:
选项:
A. 预测热卖品及交易额
B. 预测用户的偏好、流失
C. 预测经营趋势
D. 评价
答案:
问题 171: 10. 大数据是描述( )所发生的行为。
选项:
A. 未来
B. 现在
C. 实时
D. 过去
答案:
问题 172: 11. 传统研究中数据采集的方法包括:
选项:
A. 对面访谈
B. 线上互动
C. 网络监测
D. 电话访谈
答案:
问题 173: 12. 以下属于能产生大数据,即大数据的源头的有
选项:
A. 搜索引擎
B. 电子商务
C. 社交网络
D. 游戏
E. 移动互联网
F. 互联网电视
答案:
问题 174: 13. 数据挖掘常用的工具有
选项:
A. R
B. Clement
C. Gephi
D. Photoshop
答案:
问题 175: 14. 中心性研究的意义是在于衡量节点的
选项:
A. 约束力
B. 权力
C. 影响力
D. 控制力
答案:
问题 176: 15. 属于社交网络的表达形式
选项:
A. 矩阵论
B. 网论
C. 点阵论
D. 图论
答案:
问题 177: 16. 以下哪些指标是衡量大数据应用成功的标准?
选项:
A. 风险更低
B. 成本更低
C. 速度更快
D. 质量更高
答案:
问题 178: 1. 我国国内行业之间的信息化发展水平差距比较大,农业信息化属于短板。
选项:
答案:
问题 179: 2. 吴军博士认为凡是简单、重复的工作,在未来的时代里一定是机器做得比人更好。
选项:
答案:
问题 180: 3. 20世纪50年代-80年代,第一代信息传输技术只能传输4380路信号。
选项:
答案:
问题 181: 4. 大数据的价值重在挖掘,而挖掘就是分析。
选项:
答案:
问题 182: 5. 物联网的处理技术应用于农业上,可以对动物疾病、植物病虫害,通过传感器进行远程诊断。
选项:
答案:
问题 183: 6. 数据资产型企业产品线的盈利,主要通过提供收费服务来获取
选项:
答案:
问题 184: 7. 在大数据的荡畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行
选项:
答案:
问题 185: 8. 第三方数据处理模式表现为:服务商通过软件即服务或平台即服务形式主义为用户提供自己的数据上服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果
选项:
答案:
问题 186: 9. 在美国的大数据大棋中,"五眼”是指配合美国进行全球监控的包含美国、英国、加拿大兰在内的五个国家
选项:
答案:
问题 187: 10. 当前,企业提供的大数据解决方案大多基于 Ha doop 开源项目
选项:
答案:
问题 188: 11. 澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府
选项:
答案:
问题 189: 12. 大数据可以分析与挖掘前之前人们不知道或者滑注意到的模式, 可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值
选项:
答案:
问题 190: 13. 大数据最早由麦肯锡在编写《大数据时代》中提出,指不用随机分析法(抽样调查)的捷径,而是采用所有数据进行分析处理。 ()
选项:
答案:
问题 191: 14. "大数据”是需要新处理模式才能具有强大的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
选项:
答案:
问题 192: 15. 大数据的数据类型包括网络日志、音频、视频、图片、地理位置信息等等。 ()
选项:
答案:
问题 193: 16. 大数据的起始计量单位至少是 MB。()
选项:
答案:
问题 194: 1. 单选 Hive的数据计算使用
选项:
A. HDFS
B. HBASE
C. MapReduce
D. PIG
答案:
问题 195: 2. 单选 Hadoop生态系统中,最核心的设计是()
选项:
A. TEZ和PIG
B. HDFS和MAPREDUCE
C. HIVE和HDFS
D. HBASE和STORM
答案:
问题 196: 3. 单选 Web挖掘中内容挖掘的基本技术是()
选项:
A. 图片挖掘
B. 文本挖掘
C. 数据挖掘
D. 技术挖掘
答案:
问题 197: 4. 布尔权重是指如果某个词条在一篇文本中出现,则将其权值定义为(),否则定义为()
选项:
A. 1,0
B. 0,1
C. 2,0
D. 0,2
答案:
问题 198: 5. 以下哪个不是推荐系统的评测指标
选项:
A. 覆盖率
B. 新颖性
C. 统一性
D. 惊喜度
答案:
问题 199: 6. 分类变量使用( )建立预测模型。
选项:
A. 回归树
B. 决策树
C. 离散树
D. 分类树
答案:
问题 200: 7. 对线下零售而言,做好大数据分析应用的前提是( )
选项:
A. 增加数据来源
B. 开展优惠促销
C. 增加统计种类
D. 扩大营业面积
答案:
问题 201: 8. 万维网的实施国家是( )
选项:
A. 印度
B. 德国
C. 美国
D. 英国
答案:
问题 202: 9. 一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维维度中的( )
选项:
A. 因果思维
B. 定量思维
C. 实验思维
D. 相关思维
答案:
问题 203: 10. 下列关于网络用户行为的说法中,错误的是( )。
选项:
A. 数字轨迹用完即自动删除
B. 网络公司能够捕捉到用户在其网站上的所有行为
C. 用户的隐私安全很难得以规范保护
D. 用户离散的交互痕迹能够为企业提升服务质量提供参考
答案:
问题 204: 11. 下列关于计算机存储容量单位的说法中,错误的是( )。
选项:
A. 一个字节能够容纳一个英文字符,
B. 一个汉字需要一个字节的存储空间
C. 1KB<1MB<1GB
D. 基本单位是字节(Byte)
答案:
问题 205: 12. 下列关于大数据的分析理念的说法中,错误的是( )。
选项:
A. 在分析效果上更追究效率而不是绝对精确
B. 在数据规模上强调相对数据而不是绝对数据
C. 在分析方法上更注重相关分析而不是因果分析
D. 在数据基础上倾向于全体数据而不是抽样数据
答案:
问题 206: 13. 下列论据中,体现"冷眼”看大数据的观点的是( )
选项:
A. 互联网金融打破了传统的观念和行为
B. 数据资产型企业前景光明
C. 个人隐私泄露与信息安全担忧
D. 大数据医疗正在走进平民百姓
答案:
问题 207: 14. 下列国家的大数据发展行动中,视大数据为新的自然资源的国家是( )
选项:
A. 新加坡
B. 印度
C. 中国
D. 韩国
答案:
问题 208: 15. 大数据环境下的隐私担忧,主要表现为( )
选项:
A. 恶意广告的推送
B. 个人信息的被识别与暴露
C. 病毒入侵
D. 用户画像的生成
答案:
问题 209: 16. "最为成功的商业运作模式是价格最低的资源将会被尽可能的消耗,以此来保存最昂贵的资源”,这是下列哪个定律的内涵?
选项:
A. 吉尔德定律
B. 麦特卡尔夫定律
C. 摩尔定律
D. 牛顿定律
答案:
问题 210: 17. 根据周琦老师所讲,高德交通信息服务覆盖全国主干道路及其它()以上。
选项:
A. 30%
B. 90%
C. 70%
D. 50%
答案:
问题 211: 18. 大数据的本质是( )。
选项:
A. 挖掘
B. 联系
C. 洞察
D. 搜集
答案:
问题 212: 19. 由于有了现代信息技术的支撑,研制一个新型号的航天器,周期缩减到()以内。
选项:
A. 6个月
B. 24个月
C. 18个月
D. 12个月
答案:
问题 213: 20. 在数据生命周期管理实践中,( )是
选项:
A. 数据价值发觉和利用
B. 数据存储和备份规范
C. 数据管理和维护
D. 数据应用开发和管理
答案:
问题 214: 21. 在数据生命周期管理实践中,( )是执行方法。
选项:
A. 数据存储和备份规范
B. 数据管理和维护
C. 数据应用开发和管理
D. 数据价值发觉和利用
答案:
问题 215: 22. 下列国家的大数据发展行动中,集中体现"重视基础、首都先行”的国家是( )。
选项:
A. 美国
B. 日本
C. 韩国
D. 中国
答案:
问题 216: 23. 购物篮分析属于( )。
选项:
A. 描述性统计
B. 关联分析
C. 分类与预测
D. 聚类分析
答案:
问题 217: 1. 避免"数据孤岛”的方法包括:
选项:
A. 利用样本框
B. 关键匹配变量
C. 数据融合
D. 数据输入
答案:
问题 218: 2. 以下属于机器学习的是:
选项:
A. 半监督式学习
B. 监督式学习
C. 非监督式学习
D. 强化学习
答案:
问题 219: 3. 机器学习的四大类分析技术的主要算法包括()
选项:
A. 聚类分析
B. 分类与预测
C. 描述性统计
D. 关联分析
答案:
问题 220: 4. 以下哪些选项属于决策树分析的步骤?
选项:
A. 收集数据
B. 确定分析维度
C. 修剪决策树
D. 跑决策树分析
答案:
问题 221: 5. 大数据作为一种数据集合,它的含义包括( )。
选项:
A. 变化很快
B. 构成复杂
C. 数据很大
D. 很有价值
答案:
问题 222: 6. 下列关于大数据对政府政策制定的影响的说法中,错误的是( )
选项:
A. 大数据可以完美解决一切政府政策制定难题
B. 大数据有效改变了政府的决策方式
C. 大数据有助于避免传统决策方式的随意性和主观性
D. 大数推动政府从基于"实证”的决策模式走向基于"经验”的决策模式
E. 为数据拓展了政府决策的信息边界条件
答案:
问题 223: 7. 根据下图判断是聚类分析的哪种数据源
选项:
A. 距离矩阵
B. 数据矩阵
C. 相异度矩阵
D. 二模矩阵
答案:
问题 224: 8. 数据挖掘面临的问题有哪些
选项:
A. 数据缺失
B. 挖掘方法与用户交互
C. 算法的有效性和可伸缩性
D. 噪声处理
答案:
问题 225: 9. 以下Web信息特点的是
选项:
A. 信息量庞大
B. 信息是动态的
C. 垃圾信息特别多
D. 信息复杂
E. 信息使用者复杂
答案:
问题 226: 10. 文本挖掘的主要任务
选项:
A. 确立需求
B. 概念提取
C. 关键词提取
D. 可视化显示和导航
答案:
问题 227: 11. ( )是大数据应用的步骤。
选项:
A. 建模分析
B. 数据输入
C. 验证假设
D. 使用决策支持工具输出结果
答案:
问题 228: 12. 大数据的低耗能存储及高效率计算的要求,需要以下多种技术协同合作( )
选项:
A. 多源数据清洗及数据整合技术
B. 分布式云存储技术
C. 高性能并行计算技术
D. 分布式文件系统及分布式并行数据库
E. 可视化高维度展示技术
答案:
问题 229: 13. IBM公司用3个V来描述大数据的三个基本特征,这 3V是( )
选项:
A. 复杂性
B. 速度
C. 体量
D. 多样性
E. 规模
答案:
问题 230: 1. 在没有大数据的条件下,人才的发现与选拔都很难做到"全信息”,大数据能够帮助人们解决这个问题。
选项:
答案:
问题 231: 2. 大数据的应用之一是,促进健康管理的个性化和多元化。
选项:
答案:
问题 232: 3. 国务院办公厅关于深入实施"互联网+流通”行动计划的意见》要求:支持建设农产品流通全程冷链系统。
选项:
答案:
问题 233: 4. 中远物流有100多个配送中心,装GPS的上万辆车每月产生2亿条信息,据此优化运输路线,减排10%。
选项:
答案:
问题 234: 5. 《促进大数据发展行动纲要》指出,要加快政府数据开放共享,推动资源整合,提升治理能力。
选项:
答案:
问题 235: 1. 以下说法正确的是
选项:
A. Spark可以基于HDFS这样分布式文件存储系统也可以基于Tachyon这样基于内存分布式文件存储系统
B. Spark只能基于HDFS这样分布式文件存储系统
C. Spark既无法基于HDFS这样分布式文件存储系统也无法基于Tachyon这样基于内存分布式文件存储系统
D. Spark只能基于Tachyon这样基于内存分布式文件存储系统
答案:
问题 236: 2. 能同时进行交互式计算,批处理,流式计算的计算框架为
选项:
A. Spark
B. Shark
C. Storm
D. Impala
答案:
问题 237: 3. Storm属于()计算
选项:
A. 交互式
B. 流式
C. 批处理
D. 云
答案:
问题 238: 4. Spark生态图中,()提供了图存储结构和常见的图算法
选项:
A. SharkSQL
B. Tachyon
C. GraphxGraphParallel
D. SparkStreaming
答案:
问题 239: 5. 中国互联网购物者占互联网使用者的比例为:
选项:
A. 0.57
B. 0.5
C. 0.56
D. 0.55
答案:
问题 240: 6. RDD中进行map,filter,groupBy等操作属于()
选项:
A. Acter
B. Change
C. Active
D. Transformation
答案:
问题 241: 7. 大数据时代,数据使用的关键是( )。
选项:
A. 数据再利用
B. 数据收集
C. 数据分析
D. 数据存储
答案:
问题 242: 8. 下列关于数据交易市场的说法中,错误的是( )。
选项:
A. 商业化的数据交易活动催生了多方参与的第三方数据交易市场
B. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助
C. 数据交易市场是大数据资源化的必然产物
D. 数据交易市场是大数据产业发展到一定程度的产物
答案:
问题 243: 9. 数据仓库的最终目的是( )。
选项:
A. 建立数据仓库逻辑模型
B. 收集业务需求
C. 开发数据仓库的应用分析
D. 为用户和业务部门提供决策支持
答案:
问题 244: 10. 大数据的最显著特征是( )。
选项:
A. 数据规模大
B. 数据价值密度高
C. 数据处理速度快
D. 数据类型多样
答案:
问题 245: 11. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。
选项:
A. 在分析方法上更注重相关分析而不是因果分析
B. 在分析效果上更追究效率而不是绝对精确
C. 在数据规模上强调相对数据而不是绝对数据
D. 在数据基础上倾向于全体数据而不是抽样数据
答案:
问题 246: 12. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )。
选项:
A. 数据处理速度快
B. 数据类型多样
C. 数据规模大
D. 数据价值密度高
答案:
问题 247: 13. 当前社会中,最为突出的大数据环境是( )。
选项:
A. 物联网
B. 互联网
C. 自然资源
D. 综合国力
答案:
问题 248: 14. 一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证, 这体现了大数据思维维度中的( )
选项:
A. 定量思维
B. 实验思维
C. 因果思维
D. 相关思维
答案:
问题 249: 15. 下列企业中,最有可能成为典型的数据资产动营商的是( )
选项:
A. 电信运营商
B. 物联网企业
C. 互联网企业
D. 云计算企业
答案:
问题 250: 16. 万维网之父是( )。
选项:
A. 蒂姆.伯纳斯-李
B. 舍恩伯格
C. 斯科特.布朗
D. 彼得.德鲁克
答案:
问题 251: 17. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( )。
选项:
A. 数据分析员
B. 数据管理人员
C. 研究科学家
D. 软件开发工程师
答案:
问题 252: 18. 智能健康手环的应用开发,体现了( )的数据采集技术的应用。
选项:
A. 传感器
B. 统计报表
C. 网络爬虫
D. API接口
答案:
问题 253: 19. 智慧城市的构建,不包含( )。
选项:
A. 数字城市
B. 云计算
C. 物联网
D. 联网监控
答案:
问题 254: 20. Mac OS系统的开发者是( )。
选项:
A. IBM公司
B. 苹果公司
C. 惠普公司
D. 微软公司
答案:
问题 255: 1. 大数据作为一种数据集合,当我们使用这个概念的时候,实际包含有哪几层含义?
选项:
A. 构成复杂
B. 变化很快
C. 蕴含大价值
D. 数据很大
答案:
问题 256: 2. 用户建模模块的功能是
选项:
A. 获取、表示用户的兴趣偏好
B. 存储或者修改用户的兴趣偏好
C. 对用户进行识别和分类
D. 帮助用户找到需要的东西
答案:
问题 257: 3. 以下属于推荐系统产生的原因的是
选项:
A. 无明确需求
B. 信息过载
C. 具有明确需求
D. 有效信息量少
答案:
问题 258: 4. RDD操作进行的转换指的是
选项:
A. 通过已有的RDD产生新的RDD
B. 通过RDD计算得到一个或一组值
C. 进行countcollect等操作
D. 可以通过Scala集合或者Hadoop构造新的RDD
答案:
问题 259: 5. 精准营销三要素是:
选项:
A. 人
B. 物
C. 位置
D. 性别
答案:
问题 260: 6. 婴幼儿配方奶粉的线上销售增速放缓的原因包括( )。
选项:
A. 婴幼儿配方奶粉的总体需求减少
B. 线上体量足够大
C. 物流不发达
D. 线下促销倒逼
答案:
问题 261: 7. 零售数据的线上来源包括( )。
选项:
A. 全渠道覆盖
B. 合作电商的数据
C. 产品条目
D. 利用大数据对非合作电商的推算
答案:
问题 262: 8. 贵州发展大数据的顶层设计是要逐步建成三个中心,即()。
选项:
A. 大数据人才中心
B. 大数据内容中心
C. 大数据服务中心
D. 大数据金融中心
答案:
问题 263: 9. 云计算的特点包括以下哪些方面?
选项:
A. 服务可计算
B. 服务可租用
C. 低使用度
D. 高性价比
答案:
问题 264: 10. 下列选项中,属于贵州发展大数据的先天优势的是()。
选项:
A. 空气清新
B. 电力资源充沛
C. 气候凉爽
D. 远离地震带
答案:
问题 265: 11. 基于知识的推荐的产生是由于
选项:
A. 推荐系统需要利用额外的因果知识生成推荐
B. 推荐系统无法依赖购买记录进行推荐
C. 把各种推荐方法根据优缺点和试用场景进行搭配产生
D. 推荐系统会用到有关当前用户和有效物品的额外信息
答案:
问题 266: 12. 大数据处理流程可以概括为以下哪几步?
选项:
A. 导入和预处理
B. 统计和分析
C. 采集
D. 挖掘
答案:
问题 267: 13. 宁家骏委员指出,()主导了21世纪。
选项:
A. 大数据
B. 云计算
C. 移动支付
D. 物联网
答案:
问题 268: 14. 大数据的主要特征表现为()。
选项:
A. 数据类型多
B. 数据容量大
C. 商业价值高
D. 处理速度快
答案:
问题 269: 1. 林雅华博士指出,目前中国的是一个复杂社会,是一个转型社会。
选项:
答案:
问题 270: 2. 移动互联网实现了人人相连、人物相联、物物相连。
选项:
答案:
问题 271: 3. 、奥巴马认为,对大数据的占有与控制,反映的是一个国家的核心能力之大小。因此,他已经将大数据上升到国家战略高度。
选项:
答案:
问题 272: 4. 由于历史的原因,我国医院的信息化建设层次不齐、水平不一。
选项:
答案:
问题 273: 5. 网球比赛,与其他体育项目一样,涉及大量数据。
选项:
答案:
问题 274: 1. K均值算法的缺点()①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量
选项:
A. ①③
B. ①②③④⑤
C. ①③⑤
D. ②④
答案:
问题 275: 2. 关于内容深度理解建立索引说法正确的是
选项:
A. 内容索引又可以分为单索引和双索引
B. 索引分为客观索引和主观索引
C. 内容索引与客观因素有很大关系
D. 客观索引与文档内容有关
答案:
问题 276: 3. 中国的网络消费者比线下消费者更( )。
选项:
A. 年轻和富裕
B. 年老和贫困
C. 年轻和贫困
D. 年老和富裕
答案:
问题 277: 4. 大数据获取的个人信息比传统调研获得的个人信息真实性( )。
选项:
A. 更低
B. 更高
C. 不确定
D. 相同
答案:
问题 278: 5. DMP分为( )和( )。
选项:
A. 单一式DMP;封闭式DMP
B. 单一式DMP;多元式DMP
C. 开放式DMP;私有式DMP
D. 开放式DMP;封闭式DMP
答案:
问题 279: 6. 阿里巴巴旗下的数据管理平台,被称为:
选项:
A. 达摩盘
B. 招财宝
C. 蚂蚁花呗
D. 支付宝
答案:
问题 280: 7. 万维网之父是( )。
选项:
A. 斯科特•布朗
B. 彼得•德鲁克
C. 蒂姆•伯纳斯-李
D. 舍恩伯格
答案:
问题 281: 8. Mac OS系统的开发者是()。
选项:
A. 苹果公司
B. 惠普公司
C. 微软公司
D. IBM公司
答案:
问题 282: 9. 下列论据中,能够支撑"大数据无所不能”的观点的是( )。
选项:
A. 互联网金融打破了传统的观念和行为
B. 个人隐私泄露与信息安全担忧
C. 大数据具有非常高的成本
D. 大数据存在泡沫
答案:
问题 283: 10. Spark生态图中,()提供了一个机器学习的算法库
选项:
A. SharkSQL
B. MLBaseMachineLearning
C. Tachyon
D. GraphxGraphParallel
答案:
问题 284: 11. Hive2也被称为Stringer,底层的计算引擎由()替换()
选项:
A. Tez,Hdfs
B. Pig,Tez
C. MapReduce,Tez
D. Tez,MapReduce
答案:
问题 285: 12. 以下关于Pig和Hive异同的说法错误的是
选项:
A. Pig和Hive的编程语言不同
B. Pig和Hive的相同点是它们的设计动机都是为用户提供更简单的数据分析方式
C. 二者都运行在Hadoop之上
D. Pig要求待处理数据必须有Schema,而Hive则无此要求
答案:
问题 286: 13. 支撑大数据业务的基础是( )。
选项:
A. 数据应用
B. 数据硬件
C. 数据科学
D. 数据人才
答案:
问题 287: 14. 在数据生命周期管理实践中,( )是执行方法。
选项:
A. 数据存储和备份规范
B. 数据价值发觉和利用
C. 数据管理和维护
D. 数据应用开发和管理
答案:
问题 288: 15. 下列关于网络用户行为的说法中,错误的是( )。
选项:
A. 用户的隐私安全很难得以规范保护
B. 用户离散的交互痕迹能够为企业提升服务质量提供参考
C. 数字轨迹用完即自动删除
D. 网络公司能够捕捉到用户在其网站上的所有行为
答案:
问题 289: 16. 下列关于计算机存储容量单位的说法中,错误的是( )。
选项:
A. 基本单位是字节(Byte)
B. 一个汉字需要一个字节的存储空间
C. 一个字节能够容纳一个英文字符
D. 1KB<1MB<1GB
答案:
问题 290: 17. 下列关于聚类挖掘技术的说法中,错误的是( )。
选项:
A. 要求同类数据的内容相似度尽可能小
B. 要求不同类数据的内容相似度尽可能小
C. 与分类挖掘技术相似的是,都是要对数据进行分类处理
D. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
答案:
问题 291: 18. 下列国家的大数据发展行动中,集中体现"重视基础、首都先行”的国家是( )。
选项:
A. 中国
B. 韩国
C. 美国
D. 日本
答案:
问题 292: 1. 在网络爬虫的爬行策略中,应用最为基础的是( )。
选项:
A. 深度优先遍历策略
B. 大站优先策略
C. 高度优先遍历策略
D. 反向链接策略
E. 广度优先遍历策略
答案:
问题 293: 2. 当前,大数据产业发展的特点是( )。
选项:
A. 多产业交叉融合
B. 规模较大
C. 增速很快
D. 规模较小
E. 增速缓慢
答案:
问题 294: 3. 下列关于数据生命周期管理的核心认识中,正确的是( )。
选项:
A. 数据生命周期管理旨在产生效益的同时,降低生产成本
B. 数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段
C. 在不同的数据存在阶段,数据的价值是不同的
D. 根据数据价值的不同应该对数据采取不同的管理策略
E. 数据生命周期管理最终关注的是社会效益
答案:
问题 295: 4. Spark产生的原因包括
选项:
A. 现有的各种计算框架各自为战
B. Spark只能进行交互式计算
C. MapReduce具有很多的局限性
D. Spark不适合交互式处理
答案:
问题 296: 5. 关于搜索引擎步骤中分词的说法正确的是
选项:
A. 用户的查询和内容的理解都是基于分词
B. 分词的准确性决定了搜索结果的相关性排序
C. 分词的准确性决定了搜索结果是否让用户满意
D. 中文分词的准确性对搜索引擎的结果没有任何影响
答案:
问题 297: 6. 属于社交网络的表达形式()删除
选项:
A. 网论
B. 矩阵论
C. 图论
D. 点阵论
答案:
问题 298: 7. ()是大数据运用的基础。
选项:
A. 数据统计有效性
B. 隐私问题
C. 有用的数据
D. 覆盖率
答案:
问题 299: 8. 移动行业的通用需求:
选项:
A. 终端市场趋势
B. 设备分布
C. 分类应用排行
D. 人群分布
答案:
问题 300: 9. 腾讯大数据营销策略有哪些?
选项:
A. 电商推荐
B. 效果广告
C. 关系链推荐
D. 应用推荐
E. 视频推荐
答案:
问题 301: 10. 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( )。
选项:
A. 基于大数据的营销模式比传统营销模式精准性更强
B. 传统营销模式比基于大数据的营销模式针对性更强
C. 传统营销模式比基于大数据的营销模式投入更小
D. 基于大数据的营销模式比传统营销模式实时性更强
E. 传统营销模式比基于大数据的营销模式转化率低
答案:
问题 302: 11. 下列各项表述中正确的有哪些?
选项:
A. 我国中央网络安全和信息化领导小组宣告成立是在2013年。
B. 中央网络安全和信息化领导小组组长是李克强。
C. 我国中央网络安全和信息化领导小组宣告成立是在2014年。
D. 中央网络安全和信息化领导小组组长是习近平。
答案:
问题 303: 12. 贵州发展大数据的"八个一”建议包括()。
选项:
A. 引入一批人才、聚集一批创客
B. 谋划一批产业、引进一批项目
C. 制定一个工作计划、建立一个领导机构
D. 培养一批干部、出台一批政策
答案:
问题 304: 13. 云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在、越来越普及,成本越来越低。
选项:
A. 密集式
B. 密闭式
C. 共享式
D. 分布式
答案:
问题 305: 14. 郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?
选项:
A. 农业精准生产控制
B. 农作物病虫害监测
C. 农田环境监测
D. 农作物长势苗情监测
答案:
问题 306: 15. 医疗领域如何利用大数据?
选项:
A. 临床决策支持
B. 个性化医疗
C. 用户行为分析
D. 社保资金安全
答案:
问题 307: 16. 下列关于脏数据的说法中,正确的是( )。
选项:
A. 数据不完整
B. 与实际业务关系不大
C. 格式不规范
D. 意义不明确
E. 编码不统一
答案:
问题 308: 17. 2012年"中央1号文件”提出,要全面推进农业农村信息化,着力提高()的信息服务水平。
选项:
A. 市场流通
B. 农业生产经营
C. 文化交流
D. 质量安全控制
答案:
问题 309: 1. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。
选项:
答案:
问题 310: 2. 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。
选项:
答案:
问题 311: 3. 在噪声数据中,波动数据比离群点数据偏离整体水平更大。
选项:
答案:
问题 312: 4. 一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。
选项:
答案:
问题 313: 5. 谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。
选项:
答案:
问题 314: 1. ()充分利用了MapReduce和HDFS的扩展性和容错性,是基于MapReduce开发的数据挖掘,机器学习库
选项:
A. MAPREDUCE
B. YARN
C. STORM
D. MaHout
答案:
问题 315: 2. 特征抽取常用算法的互信息,互信息值()表示词条和类别的共现程度()
选项:
A. 越大,越大
B. 越小,越小
C. 越大,越小
D. 越小,越大
答案:
问题 316: 3. RDD中进行count,collect,save等操作属于()
选项:
A. Acter
B. Active
C. Transformation
D. Change
答案:
问题 317: 4. 根据PageRank算法的基本思想,以下哪种情况说明了页面的重要性
选项:
A. 被非重要的页面引用的页面
B. 被多次引用的页面
C. 页面的重要性无法传递
D. 没有被多次引用的页面
答案:
问题 318: 5. Web应用挖掘中最有效而且简单的分析方法是
选项:
A. 结构分析
B. 点击流分析
C. 数据挖掘
D. 内容分析
答案:
问题 319: 6. Hadoop生态系统中,集群的资源管理系统是()
选项:
A. MAPREDUCE
B. STORM
C. YARN
D. HDFS
答案:
问题 320: 7. Hadoop提供的MapReduce的编程方式中,()是最原始的方式
选项:
A. HadoopPipes
B. HadoopStreaming
C. PHP
D. Java
答案:
问题 321: 8. 大数据的起源是( )
选项:
A. 电信
B. 金融
C. 公共管理
D. 互联网
答案:
问题 322: 9. 智慧城市的智慧之源是( )
选项:
A. 大数据
B. 云计算
C. 物联网
D. 数字城市
答案:
问题 323: 10. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是( )关系,而吸烟和肺癌则是()关系
选项:
A. 因果相关
B. 因果并列
C. 相关因果
D. 并列相关
答案:
问题 324: 11. 下列关于数据交易市场的说法中,错误的是( )
选项:
A. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助
B. 数据交易市场是大数据产业发展到一定程度的产物
C. 数据交易市场是大数据资源化的必然产物
D. 商业化的数据交易活动催生了多方参与的第三方数据交市场
答案:
问题 325: 12. 当前大数据技术的基础是由( )首先提出的
选项:
A. 微软
B. 百度
C. 谷歌
D. 阿里巴巴
答案:
问题 326: 13. 下列演示方式中,不属于传统统计图方式的是( )
选项:
A. 柱状图
B. 饼状图
C. 曲线图
D. 网络图
答案:
问题 327: 14. 支撑大数据业务的基础是( )。
选项:
A. 数据人才
B. 数据硬件
C. 数据科学
D. 数据应用
答案:
问题 328: 15. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )
选项:
A. 数据规模大
B. 数据类型多样
C. 数据处理速度快
D. 数据价值密度高
答案:
问题 329: 16. 下列关于大数据的分析理念的说法中,错误的是( )
选项:
A. 在数据基础上倾向于全体数据而不是抽样数据
B. 在分析方法上更注重相关分析而不是因果分析
C. 在分析效果上更追求效率而不是绝对精确
D. 在数据规模上强调相对数据而不是绝对数据
答案:
问题 330: 17. 下列关于普查的缺点的说法中,正确的是( )
选项:
A. 对样本的依赖比较强
B. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象
C. 误差不易被控制
D. 评测结果不够稳定
答案:
问题 331: 18. 下列关于聚类挖掘技术的说法中,错误的是( )
选项:
A. 要求不同类数据的内容相似度尽可能小
B. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
C. 要求同类数据的内容相似度尽可能小
D. 与分类挖掘技术相似的是,都是要对数据进行分类处理
答案:
问题 332: 19. 智慧城市的构建,不包含( )
选项:
A. 云计算
B. 联网监控
C. 数字城市
D. 物联网
答案:
问题 333: 1. 传统数据密集型行业积极探索和布局大数据应用的表现是( )。
::多选题::27 、多选 Spark产生的原因包括{
~%50%MapReduce具有很多的局限性
~%-100%Spark不适合交互式处理
~%50%现有的各种计算框架各自为战
~%-100%Spark只能进行交互式计算
}
选项:
A. 打通多源跨域数据
B. 投资入股互联网电商行业
C. 提高分析挖掘能力
D. 自行开发数据产品
E. 实现科学决策与运营
答案:
问题 334: 2. 中国电信把自己的大数据开发分为:
选项:
A. 服务类应用
B. 媒体类应用
C. 广告类应用
D. 商品类应用
答案:
问题 335: 3. 百度大数据的特点有哪些?
选项:
A. 具有大量搜索数据
B. 具有大量网购数据
C. 具有大量移动端数据
D. 具有消费者位置数据
答案:
问题 336: 4. 大数据行业就业三大方向是:
选项:
A. 大数据应用开发类人才
B. 管理大数据的人才
C. 大数据系统研发类人才
D. 大数据分析类人才
答案:
问题 337: 5. 首席数据官CDO需要从哪几个层面推动数据使用机制创新与优化?
选项:
A. 保护
B. 聚合
C. 维护
D. 货币化
E. 利用
答案:
问题 338: 6. 数据再利用的意义在于( )。
选项:
A. 提高社会效益,优化社会管理
B. 利用数据可扩展性拓宽业务领域
C. 实现数据重组的创新价值
D. 优化存储设备,降低设备成本
E. 挖掘数据的潜在价值
答案:
问题 339: 7. 大数据人才整体上需要具备( )等核心知识。
选项:
A. 数学与统计知识
B. 市场运营管理知识
C. 在特定业务领域的知识
D. 计算机相关知识
E. 马克思主义哲学知识
答案:
问题 340: 8. 下列关于大数 据的说法中,错误的是( )。
选项:
A. 大数据的目的在于发现新的知识与洞察并进行科学决策
B. 处理大数据需采用新型计算架构和智能算法等新技术
C. 大数据具有体量大、结构单一、时效性强的特征
D. 大数据的应用注重因果分析而不是相关分析
E. 大数据的应用注重相关分析而不是因果分析
答案:
问题 341: 9. 20世纪中后期至今的媒介革命,以( )的出现为标志。
选项:
A. 数字化
B. 计算机
C. 互联网
D. 自动化
答案:
问题 342: 10. 大数据的应用能够实现一场新的革命,提高综合管理水平的原因是
选项:
A. 从被动反应走向主动预见型管理
B. 从柜台式管理走向全天候管理
C. 从单兵作战走向联合共享型管理
D. 从粗放化管理走向精细化管理
答案:
问题 343: 11. 建立大数据需要设计一个什么样的大型系统?
选项:
A. 能够把应用放到合适的平台上
B. 能够存储数据
C. 能够处理数据
D. 能够开发出相应应用
答案:
问题 344: 12. 大数据的应用能够实现一场新的革命,提高综合管理水平的原因是( )。
选项:
A. 从被动反应走向主动预见型管理
B. 从单兵作战走向联合共享型管理
C. 从柜台式管理走向全天候管理
D. 从粗放化管理走向精细化管理
答案:
问题 345: 13. 下列哪些国家已经将大数据上升为国家战略?
选项:
A. 日本
B. 法国
C. 英国
D. 美国
答案:
问题 346: 14. 以下哪些是数据科学家的职责?
选项:
A. 数据库管理
B. 角色制定
C. 应用问题的解决
D. 建立分析模型
E. 数据分析
答案:
问题 347: 15. 电信运营商大数据整合哪些整体数据?
选项:
A. 固定电话
B. 手机
C. 宽带
D. 流量
答案:
问题 348: 16. 按照涉及自变量的多少,可以将回归分析分为( )。
选项:
A. 多元回归分析
B. 非线性回归分析
C. 线性回归分析
D. 综合回归分析
E. 一元回归分析
答案:
问题 349: 1. 当前社会中,最为突出的大数据环境是( )
选项:
A. 自然资源
B. 互联网
C. 综合国力
D. 物联网
答案:
问题 350: 2. 可以对大数据进行深度分析的平台工具是( )
选项:
A. 传统的机器学习和数据分析肛具
B. 第一代机器学习工具
C. 第二代机器学习工具
D. 未来机器学习工具
答案:
问题 351: 3. 关于大数据在社会综合治理中的作用,以下理解不正确的是( )。
选项:
A. 大数据的运用能够杜绝抗生素的滥用
B. 大数据的运用能够加强交通管理
C. 大数据的运用能够维护社会治安
D. 大数据的运用有利于走群众路线
答案:
问题 352: 4. 关于推荐系统的说法错误的是
选项:
A. 推荐系统的相关技术包括机器学习及数据挖掘算法等
B. 推荐系统的常见表现形式有猜你喜欢、买了又买、精品推荐等
C. 推荐系统的架构为离线计算-在线计算-推荐引擎APP
D. 推荐系统经历了很短的时间形成
答案:
问题 353: 5. 以下关于搜索引擎说法错误的是
选项:
A. 是能依据用户需求查找相应信息的在线搜索系统
B. 是基于web相关技术为基础的
C. 呈现的搜索结果是凌乱无序的
D. 是对网络信息资源进行抓取和采集建立索引数据库
答案:
问题 354: 6. 大数据可能带来( ),但未必能够带来( )。
选项:
A. 准确度;精确度
B. 精确度;多样性
C. 精确度;准确度
D. 多样性;准确度
答案:
问题 355: 7. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( )。
选项:
A. 软件开发工程师
B. 数据分析员
C. 数据管理人员
D. 研究科学家
答案:
问题 356: 8. 以下选项中,不属于信息时代的定律的是( )。
选项:
A. 麦特卡尔夫定律
B. 达律多定律
C. 摩尔定律
D. 吉尔德定律
答案:
问题 357: 9. 第一个提出大数据概念的公司是
选项:
A. 微软公司
B. 脸谱公司
C. 谷歌公司
D. 麦肯锡公司
答案:
问题 358: 10. 以下选项中,不属于大数据对人才能力的要求是
选项:
A. 业务能力
B. IT技术能力
C. 数学统计能力
D. 逻辑思维能力
答案:
问题 359: 11. Web2.0强调()。
选项:
A. 单位
B. 个人
C. 网站
D. 机构
答案:
问题 360: 12. 根据周琦老师所讲,高德交通日均采集数十亿定位请求,系统处理月均()公里驾驶里程覆盖。
选项:
A. 80亿
B. 150亿
C. 50亿
D. 100亿
答案:
问题 361: 13. 大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()。
选项:
A. 新一代技术平台
B. 新一代服务业态
C. 新一代信息技术
D. 新一代信息技术和服务业态
答案:
问题 362: 14. 大数据整合要保证各个数据源之间的( )。
选项:
A. 一致性、差异性
B. 一致性、相容性
C. 一致性、协调性
D. 差异性、协调性
答案:
问题 363: 15. 在数据生命周期管理实践中,( )是执行方法。
选项:
A. 数据价值发觉和利用
B. 数据管理和维护
C. 数据应用开发和管理
D. 数据存储和备份规范
答案:
问题 364: 16. 下列国家的大数据发展行动中,集中体现"重视基础、首都先行”的国家是( )。
选项:
A. 韩国
B. 中国
C. 日本
D. 美国
答案:
问题 365: 17. 购物篮分析属于( )。
选项:
A. 关联分析
B. 分类与预测
C. 描述性统计
D. 聚类分析
答案:
问题 366: 18. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。
选项:
A. 在分析效果上更追究效率而不是绝对精确
B. 在分析方法上更注重相关分析而不是因果分析
C. 在数据基础上倾向于全体数据而不是抽样数据
D. 在数据规模上强调相对数据而不是绝对数据
答案:
问题 367: 19. 下列关于舍恩伯格对大数据特点的说法中,错误的是( )。
选项:
A. 数据价值密度高
B. 数据处理速度快
C. 数据规模大
D. 数据类型多样
答案:
问题 368: 20. 当前社会中,最为突出的大数据环境是( )。
选项:
A. 物联网
B. 互联网
C. 综合国力
D. 自然资源
答案:
问题 369: 21. 一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证, 这体现了大数据思维维度中的( )
选项:
A. 定量思维
B. 因果思维
C. 相关思维
D. 实验思维
答案:
问题 370: 22. 下列企业中,最有可能成为典型的数据资产动营商的是( )
选项:
A. 电信运营商
B. 互联网企业
C. 物联网企业
D. 云计算企业
答案: