24春学期(高起本:1709-2103、专升本/高起专:2003-2103)《并行程序设计》在线作业-00001
试卷总分:100 得分:100
一、单选题 (共 50 道试题,共 100 分)
1.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=1则表示___。
A.将第一个源寄存器的第j个元素放在目标寄存器位置1
B.将第二个源寄存器的第j个元素放在目标寄存器位置1
C.将第一个源寄存器的第j个元素放在目标寄存器位置j
D.将第二个源寄存器的第j个元素放在目标寄存器位置j
2.记并行时间为T,串行时间为T',处理器数量为p,则额外开销应如何计算?
A.T'-T
B.T-T'
C.pT
D.pT-T'
3.两个矩阵相乘前将第二个矩阵转置,是使用利用数据访问的_____达到更高的cache命中率。
A.时间局部性
B.空间局部性
C.计算局部性
D.混合局部性
4.起泡排序改为奇偶转置排序,消除了循环步间的数据依赖的原因是____。
A.增大了元素比较距离
B.减小了元素比较距离
C.改为元素两两分组比较
D.消除了元素比较
5.为了解决CPU内流水线深度限制,主要的技术手段是____。
A.降低指令复杂度
B.去掉分支预测功能
C.增大核心数
D.超标量技术
6.将寄存器设置为4个单精度浮点数0.0的SSE intrinsics指令是____。
A._mm_set_ps
B._mm_set1_ss
C._mm_setzero_ss
D._mm_setzero_ps
7.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=0则表示___。
A.将第一个源寄存器的第j个元素放在目标寄存器位置0
B.将第二个源寄存器的第j个元素放在目标寄存器位置0
C.将第一个源寄存器的第j个元素放在目标寄存器位置j
D.将第二个源寄存器的第j个元素放在目标寄存器位置j
8.Pthread不支持____。
A.创建并发执行线程
B.同步
C.非显式通信
D.自动并行化
9.主线程要求从线程退出应采用____。
A.pthread_create
B.pthread_exit
C.pthread_quit
D.pthread_cancel
10.新一代GPU重点提供的新特性不包括____。
A.新型高速显存
B.GPU间直接高速互联
C.自动并行化
D.人工智能计算专门优化
11.当处理器数量不变时,随着问题规模增大,效率增大对____成立。
A.部分并行算法
B.所有并行算法
C.所有并行算法都不
D.以上皆错
12.并行计算的新兴应用领域不包括____。
A.制药
B.数字媒体
C.国防
D.游戏
13.限制CPU内流水线深度的因素包括_____。
A.指令复杂程度
B.分支预测性能
C.CPU核心数
D.CPU cache大小
14.神威.太湖之光采用的申威26010处理器是一种____架构。
A.单核
B.多核
C.众核
D.多CPU
15.对矩阵乘法进行多线程并行化,对矩阵采用____。
A.简单均匀块划分即可保证负载均衡
B.循环划分才能实现负载均衡
C.动态划分才能实现负载均衡
D.随机划分才能实现负载均衡
16.使用____无法直接实现“主线程唤醒4个从线程去执行任务”。
A.1个信号量
B.障碍
C.1个互斥量
D.4个互斥量
17.对划分输入数据的策略,下面说法错误的是____。
A.当输出数据很少时,需划分输入数据
B.当输出数据存在依赖时,需划分输入数据
C.通常最后需要汇总结果
D.由于不是直接划分输出数据,性能会很差
18.一个Neon寄存器最多存放____个短整型数。
A.2
B.4
C.8
D.16
19.定期评选全球计算能力最强的超级计算机的国际组织是____。
A.top500
B.green500
C.graph500
D.super500
20.OpenMP中指定单线程执行的指令是____。
A.omp atomic
B.omp only
C.omp static
D.omp single
21.对天气预报问题,将大气层划分为5*10^8个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为5分钟,计算30天内大气运动,100MFlops计算能力的计算机需要多少天?
A.1
B.10
C.100
D.300
22.关于MPI_recv对源地址的标识,下列说法正确的是____。
A.只能使用进程编号
B.可以使用IP地址
C.可以使用IPV6地址
D.可以使用MPI_ANY_SOURCE
23.OpenMP的优点不包括____。
A.从头编写并行程序很自然
B.串行程序并行化简单
C.不必关心低层细节
D.可移植、可扩展
24.互斥量mutex机制,在任何时刻____进入它保护的区域。
A.允许任意数量任意类型的线程
B.允许一个读线程任意个写线程
C.允许一个写线程任意个读线程
D.只允许一个线程
25.对于加速比S和处理器数量p,下列说法正确的是____。
A.有可能S>p
B.必然S<p
C.不可能S=p
D.两者无关联
26.CUDA线程层次中不包括____。
A.Kernel
B.Grid
C.Block
D.Thread
27.对单精度浮点数矩阵乘法程序进行SSE并行化,预期加速比为____。
A.等于8
B.4到8之间
C.等于4
D.小于4
28.一个Neon寄存器最多存放____个整型数。
A.2
B.4
C.8
D.16
29.MPI基本原语不包括____。
A.MPI_Barrier
B.MPI_Comm_rank
C.MPI_Comm_size
D.MPI_Init
30.天河1A和天河2号都是主要依靠____获得强大的计算能力。
A.单核CPU
B.多核CPU
C.众核CPU
D.众核协处理器
31.以下哪条不是推动并行计算发展的因素?
A.存储是系统瓶颈
B.单CPU发展已能满足应用需求
C.利用标准硬件构造并行机令升级容易
D.编程环境标准化逐步发展
32.一个函数是“线程安全的”,其含义是该函数____。
A.多线程执行能抵御网络攻击
B.多线程执行能保护用户隐私数据
C.多线程执行结果也是正确的
D.以上皆错
33.对于搜索分解,下面哪个说法是错误的_____。
A.所有子树搜索任务都必须全部完成
B.工作量可能大于串行计算
C.工作量可能小于串行计算
D.可能产生超线性加速比
34.在下面问题中,SIMD并行更适合____。
A.搜索
B.排序
C.矩阵乘法
D.构建二叉排序树
35.多对多广播/归约高效算法基于____。
A.递归思想
B.流水线思想
C.分治思想
D.贪心思想
36.在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买记录划分给不同进程,这是一种划分____的数据并行策略。
A.输入数据
B.中间结果
C.输出数据
D.临时数据
37.AVX是____平台的SIMD架构。
A.x86
B.POWER
C.SPARC
D.ARM
38.主线程创建了4个线程,它们打印各自的线程号(0-3),未使用任何同步,则输出顺序____。
A.必然是0 1 2 3
B.必然是4 3 2 1
C.不可能是4 3 2 1
D.以上皆错
39.CUDA的优点不包括____。
A.可移植性
B.入门简单
C.标准的SPMD模式
D.不再需要图形API
40.SIMD并行模式是将多个____运算打包并发执行。
A.不同
B.相同
C.混合
D.依赖
41.CUDA程序中不包括____。
A.host代码
B.device代码
C.kernel
D.图形渲染代码
42.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。
A.初始化
B.第二个矩阵转置循环
C.矩阵元素乘—加计算的循环
D.结果输出
43.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
A.正确的
B.错误的
44.n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。
A.肯定不是代价最优
B.肯定是代价最优
C.不确定是否代价最优
D.以上皆错
45.两个MPI进程A和B相互收发消息,关于死锁下面说法正确的是____。
A.均为先向对方发再从对方收不会产生死锁
B.均为先向对方发再从对方收可能产生死锁
C.一个先发后收另一个先收后发必然死锁
D.一个先发后收另一个先收后发不会产生死锁
46.pthread_sem_post是对信号量进行____操作。
A.加锁
B.解锁
C.加1
D.减1
47.下列子句中____不是OpenMP的同步指令。
A.nowait
B.critical
C.atomic
D.barrier
48.MPI程序中默认的通信域是____。
A.MPI_ANY_SOURCE
B.MPI_ANY_TAG
C.MPI_ANY_COMM
D.MPI_COMM_WORLD
49.OpenMP编译指示的作用范围是____。
A.其后一个语句
B.其后连续语句
C.其后直到函数结束
D.整个函数
50.编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16