在线留言 注册 登录
热门搜索:形考答案免费答案奥鹏答案

南开24春学期《并行程序设计》在线作业【标准答案】

Time2024-05-19Hits浏览量: 70
有奥鹏院校所有作业、毕业论文,详情请咨询请添加QQ : 103092222或微信: xyzlfx100

24春学期(高起本:1709-2103、专升本/高起专:2003-2103)《并行程序设计》在线作业-00001

试卷总分:100  得分:100

一、单选题 (共 50 道试题,共 100 分)

1.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=1则表示___。

A.将第一个源寄存器的第j个元素放在目标寄存器位置1

B.将第二个源寄存器的第j个元素放在目标寄存器位置1

C.将第一个源寄存器的第j个元素放在目标寄存器位置j

D.将第二个源寄存器的第j个元素放在目标寄存器位置j


2.记并行时间为T,串行时间为T',处理器数量为p,则额外开销应如何计算?

A.T'-T

B.T-T'

C.pT

D.pT-T'


3.两个矩阵相乘前将第二个矩阵转置,是使用利用数据访问的_____达到更高的cache命中率。

A.时间局部性

B.空间局部性

C.计算局部性

D.混合局部性


4.起泡排序改为奇偶转置排序,消除了循环步间的数据依赖的原因是____。

A.增大了元素比较距离

B.减小了元素比较距离

C.改为元素两两分组比较

D.消除了元素比较


5.为了解决CPU内流水线深度限制,主要的技术手段是____。

A.降低指令复杂度

B.去掉分支预测功能

C.增大核心数

D.超标量技术


6.将寄存器设置为4个单精度浮点数0.0的SSE intrinsics指令是____。

A._mm_set_ps

B._mm_set1_ss

C._mm_setzero_ss

D._mm_setzero_ps


7.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=0则表示___。

A.将第一个源寄存器的第j个元素放在目标寄存器位置0

B.将第二个源寄存器的第j个元素放在目标寄存器位置0

C.将第一个源寄存器的第j个元素放在目标寄存器位置j

D.将第二个源寄存器的第j个元素放在目标寄存器位置j


8.Pthread不支持____。

A.创建并发执行线程

B.同步

C.非显式通信

D.自动并行化


9.主线程要求从线程退出应采用____。

A.pthread_create

B.pthread_exit

C.pthread_quit

D.pthread_cancel


10.新一代GPU重点提供的新特性不包括____。

A.新型高速显存

B.GPU间直接高速互联

C.自动并行化

D.人工智能计算专门优化


11.当处理器数量不变时,随着问题规模增大,效率增大对____成立。

A.部分并行算法

B.所有并行算法

C.所有并行算法都不

D.以上皆错


12.并行计算的新兴应用领域不包括____。

A.制药

B.数字媒体

C.国防

D.游戏


13.限制CPU内流水线深度的因素包括_____。

A.指令复杂程度

B.分支预测性能

C.CPU核心数

D.CPU cache大小


14.神威.太湖之光采用的申威26010处理器是一种____架构。

A.单核

B.多核

C.众核

D.多CPU


15.对矩阵乘法进行多线程并行化,对矩阵采用____。

A.简单均匀块划分即可保证负载均衡

B.循环划分才能实现负载均衡

C.动态划分才能实现负载均衡

D.随机划分才能实现负载均衡


16.使用____无法直接实现“主线程唤醒4个从线程去执行任务”。

A.1个信号量

B.障碍

C.1个互斥量

D.4个互斥量


17.对划分输入数据的策略,下面说法错误的是____。

A.当输出数据很少时,需划分输入数据

B.当输出数据存在依赖时,需划分输入数据

C.通常最后需要汇总结果

D.由于不是直接划分输出数据,性能会很差


18.一个Neon寄存器最多存放____个短整型数。

A.2

B.4

C.8

D.16


19.定期评选全球计算能力最强的超级计算机的国际组织是____。

A.top500

B.green500

C.graph500

D.super500


20.OpenMP中指定单线程执行的指令是____。

A.omp atomic

B.omp only

C.omp static

D.omp single


21.对天气预报问题,将大气层划分为5*10^8个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为5分钟,计算30天内大气运动,100MFlops计算能力的计算机需要多少天?

A.1

B.10

C.100

D.300


22.关于MPI_recv对源地址的标识,下列说法正确的是____。

A.只能使用进程编号

B.可以使用IP地址

C.可以使用IPV6地址

D.可以使用MPI_ANY_SOURCE


23.OpenMP的优点不包括____。

A.从头编写并行程序很自然

B.串行程序并行化简单

C.不必关心低层细节

D.可移植、可扩展


24.互斥量mutex机制,在任何时刻____进入它保护的区域。

A.允许任意数量任意类型的线程

B.允许一个读线程任意个写线程

C.允许一个写线程任意个读线程

D.只允许一个线程


25.对于加速比S和处理器数量p,下列说法正确的是____。

A.有可能S>p

B.必然S<p

C.不可能S=p

D.两者无关联


26.CUDA线程层次中不包括____。

A.Kernel

B.Grid

C.Block

D.Thread


27.对单精度浮点数矩阵乘法程序进行SSE并行化,预期加速比为____。

A.等于8

B.4到8之间

C.等于4

D.小于4


28.一个Neon寄存器最多存放____个整型数。

A.2

B.4

C.8

D.16


29.MPI基本原语不包括____。

A.MPI_Barrier

B.MPI_Comm_rank

C.MPI_Comm_size

D.MPI_Init


30.天河1A和天河2号都是主要依靠____获得强大的计算能力。

A.单核CPU

B.多核CPU

C.众核CPU

D.众核协处理器


31.以下哪条不是推动并行计算发展的因素?

A.存储是系统瓶颈

B.单CPU发展已能满足应用需求

C.利用标准硬件构造并行机令升级容易

D.编程环境标准化逐步发展


32.一个函数是“线程安全的”,其含义是该函数____。

A.多线程执行能抵御网络攻击

B.多线程执行能保护用户隐私数据

C.多线程执行结果也是正确的

D.以上皆错


33.对于搜索分解,下面哪个说法是错误的_____。

A.所有子树搜索任务都必须全部完成

B.工作量可能大于串行计算

C.工作量可能小于串行计算

D.可能产生超线性加速比


34.在下面问题中,SIMD并行更适合____。

A.搜索

B.排序

C.矩阵乘法

D.构建二叉排序树


35.多对多广播/归约高效算法基于____。

A.递归思想

B.流水线思想

C.分治思想

D.贪心思想


36.在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买记录划分给不同进程,这是一种划分____的数据并行策略。

A.输入数据

B.中间结果

C.输出数据

D.临时数据


37.AVX是____平台的SIMD架构。

A.x86

B.POWER

C.SPARC

D.ARM


38.主线程创建了4个线程,它们打印各自的线程号(0-3),未使用任何同步,则输出顺序____。

A.必然是0 1 2 3

B.必然是4 3 2 1

C.不可能是4 3 2 1

D.以上皆错


39.CUDA的优点不包括____。

A.可移植性

B.入门简单

C.标准的SPMD模式

D.不再需要图形API


40.SIMD并行模式是将多个____运算打包并发执行。

A.不同

B.相同

C.混合

D.依赖


41.CUDA程序中不包括____。

A.host代码

B.device代码

C.kernel

D.图形渲染代码


42.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。

A.初始化

B.第二个矩阵转置循环

C.矩阵元素乘—加计算的循环

D.结果输出


43.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。

A.正确的

B.错误的


44.n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。

A.肯定不是代价最优

B.肯定是代价最优

C.不确定是否代价最优

D.以上皆错


45.两个MPI进程A和B相互收发消息,关于死锁下面说法正确的是____。

A.均为先向对方发再从对方收不会产生死锁

B.均为先向对方发再从对方收可能产生死锁

C.一个先发后收另一个先收后发必然死锁

D.一个先发后收另一个先收后发不会产生死锁


46.pthread_sem_post是对信号量进行____操作。

A.加锁

B.解锁

C.加1

D.减1


47.下列子句中____不是OpenMP的同步指令。

A.nowait

B.critical

C.atomic

D.barrier


48.MPI程序中默认的通信域是____。

A.MPI_ANY_SOURCE

B.MPI_ANY_TAG

C.MPI_ANY_COMM

D.MPI_COMM_WORLD


49.OpenMP编译指示的作用范围是____。

A.其后一个语句

B.其后连续语句

C.其后直到函数结束

D.整个函数


50.编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。

A.2

B.4

C.8

D.16


吐血推荐

奥鹏,国开形考,广开,电大在线,各省平台,新疆一体化,各类成人教育等学习。详情请咨询QQ : 103092222或微信: xyzlfx100

添加微信查看答案

南开24春学期《并行程序设计》在线作业【标准答案】_学优资料分享网

添加微信二维码,了解更多学习技巧,平 台作业、毕业论文完成时间友情提醒。。

合作洽谈

诚信为本,合作共赢

欢迎各大学习中心前来治谈;有意请联系我们

推荐作业

留言板
captcha
感谢留言
我们会尽快与您联系
关闭