假设要使用HPL程序在4个进程上解一个4096 * 4096的方程组(4096 * 4096的矩阵加一列方程组的右端项b),按照讲义第14页所示的block-cyclic方式对数据进行分配,NB=512。4个进程按1 * 4和4 * 1两种方式排布。那么,在HPL的回代部分(讲义48到55页),X的各个元素分别是由哪些进程算出的?例如,X[0..512]由进程(3, 0)求出。写出两种排布方式下X的各部分分别由哪些进程计算得到。(5分)
X | 进程 |
---|
X[0..511] | (0,0) |
X[512..1023] | (0,1) |
X[1024..1535] | (0,2) |
X[1536..2047] | (0,3) |
X[2048..2559] | (0,0) |
X[2560..3071] | (0,1) |
X[3072..3583] | (0,2) |
X[3584..4095] | (0,3) |
X | 进程 |
---|
X[0..511] | (0,0) |
X[512..1023] | (0,1) |
X[1024..1535] | (0,2) |
X[1536..2047] | (0,3) |
X[2048..2559] | (0,0) |
X[2560..3071] | (0,1) |
X[3072..3583] | (0,2) |
X[3584..4095] | (0,3) |