首页 > 电子期刊 > J > 计算机时代

基于GPU—CUDA的共轭斜量法实现及性能对比

设备端拷贝回主机。3 共轭斜量法的性能测试[9-10]为了充分验证算法的正确性、稳定性,以及进行算法的性能测试,通过如下源代码随机生成任意阶线性方程组。在基于Linux系统的Acer ASPIRE 4736G手提电脑(含512M内存、8个流处理器的Geforce G105M图形卡)上进行了大量共轭斜量法、高斯列主元消去法试验。试验结果表明:并行算法与串行算法求解线性方程组的结果一致,当线性方程组的阶数小于600时,基于GPU-CUDA的并行算法较CPU算法耗时;当阶数大于700后,并行算法处理效率明显高于串行算法,并具有较高的加速比。试验结果如表1所示。由于Geforce G105M仅是NVIDIA公司的低端GPU显卡,所以加速比不高,如果换成具有更多流处理器的GPU显卡,将会获得非常大的加速比。通过与高斯列主元消去法的试算结果对比,得到如下重要结果。⑴ 由于高斯列主元消去法中回代求解过程无法实现并行处理,基于GPU-CUDA的高斯列主元消去法比基于CPU的算法计算速度慢且稳定性差。因此,基于CPU的高斯列主元消去法仍然是目前
<<上一页  下一页>>

首页 > 电子期刊 > J > 计算机时代

广州市越秀区图书馆版权所有。
联系电话:020-87673002

本站访问人数: