Back
Featured image of post 【分布式与并行计算】并行作业-3

【分布式与并行计算】并行作业-3

并行计算第三次作业

1 HPL(High Performance Linpack)

假设要使用HPL程序在4个进程上解一个4096 * 4096的方程组(4096 * 4096的矩阵加一列方程组的右端项b),按照讲义第14页所示的block-cyclic方式对数据进行分配,NB=512。4个进程按1 * 4和4 * 1两种方式排布。那么,在HPL的回代部分(讲义48到55页),X的各个元素分别是由哪些进程算出的?例如,X[0..512]由进程(3, 0)求出。写出两种排布方式下X的各部分分别由哪些进程计算得到。(5分)

  • 1 * 4 排布

image-20211214170301242
image-20211214170301242

X进程
X[0..511](0,0)
X[512..1023](0,1)
X[1024..1535](0,2)
X[1536..2047](0,3)
X[2048..2559](0,0)
X[2560..3071](0,1)
X[3072..3583](0,2)
X[3584..4095](0,3)
  • 4 * 1 排布

image-20211214170325158
image-20211214170325158

X进程
X[0..511](0,0)
X[512..1023](0,1)
X[1024..1535](0,2)
X[1536..2047](0,3)
X[2048..2559](0,0)
X[2560..3071](0,1)
X[3072..3583](0,2)
X[3584..4095](0,3)