基于GPU—CUDA的共轭斜量法实现及性能对比
解线性方程组最好的方法之一。⑵ 对于共轭斜量法,当线性方程组阶数大于2000时,基于CPU的算法已相当耗时,基于GPU-CUDA的算法仍然具有6以上的加速比。线性方程组阶数越大,加速比越大,阶数超过3000阶时,加速比达14以上。4 结束语在分析共轭斜量法求解大型线性方程组原理及算法的基础上,设计并实现了基于GPU-CUDA的共轭斜量法的快速算法。通过大量的随机大型线性方程组的求解试验,得到以下两个具有重要意义的结论。⑴ 基于GPU-CUDA的共轭斜量法不仅运行效率高,当线性方程组阶数超过700阶时,算法的加速比超过6,线性方程组阶数超过3000阶时,加速比达14以上。与此同时,基于GPU-CUDA的共轭斜量法在求解的精确性方面与列主元消去法相当。当线性方程组阶数大于3500后,尽管加速比变得更大,但是,其稳定性较CPU算法差,主要原因是基于GPU算法的误差积累所致。⑵ 通过将一般性线性方程组系数矩阵A作ATA转换,右端项b作ATb转换后,即可应用基于GPU-CUDA的共轭斜量法求解线性方程组,从而拓展
<<上一页 下一页>>
广州市越秀区图书馆版权所有。
联系电话:020-87673002
本站访问人数: