基于GPU—CUDA的共轭斜量法实现及性能对比

但是，该方法最大缺点是仅适用于线性方程组系数矩阵为对称正定矩阵的方程组，而且非常耗时，难以满足求解1000阶以上线性方程组的要求。在应用GPU新技术求解大型线性方程组方面，文献[6]成功应用GPU技术实现了LU分解和Laplace算法。文献[1]和文献[3]分别利用片元着色器编程和预处理平方根共轭梯度法（Preconditioned Conjugate Gradients Squared，PCGS），实现了基于GPU的共轭梯度法，有效加速了线性方程组的求解，但是，实现方法非常复杂。本文使用计算统一设备架构CUDA（Compute Unified Device Architecture）技术，将方程组系数矩阵A作ATA转换成对称矩阵后，通过CPU与GPU的协同来实现基于GPU-CUDA的快速共轭斜量法，实现方法简单并获得了较大的加速比。1 共轭斜量法原理及算法[5，8]共轭斜量法与最速下降法同属于一种方法—变分法。首先将线性方程组Ah=b的解h=A-1b（向量）看作是自变量x（向量）的某一个二次函数的极小点（使函数f（x）达到极小的点），然后用迭代法求f（x）的极小点，借以求出线性方程组Ah=b的解
<<上一页下一页>>

首页 > 电子期刊 > J > 计算机时代

本站访问人数：