期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
SEMD:一种面向实际数值模拟软件的跨平台自动性能优化编程工具
张鹏, 张爱清, 莫则尧, 王景焘
计算物理    2024, 41 (1): 52-63.   DOI: 10.19596/j.cnki.1001-246x.8777
摘要274)   HTML6)    PDF (14870KB)(1175)   

针对手工软件性能优化缺乏可复用性和可移植性的问题, 设计实现一种面向实际数值模拟软件的跨平台自动性能优化编程工具SEMD (Single element-based computing multiple data)。SEMD采用数值模拟领域基于网格的高层语义对数值计算循环进行抽象, 完全屏蔽底层硬件特征和性能优化实现, 使得基于其编写的数值计算子程序能够自动实现跨平台性能可移植。典型算例测试结果显示: 在X86、ARM、GPU三种不同架构的处理器上, SEMD的整体性能优化效果超过国际上的同类产品。此外, SEMD在结构、流体、电磁等领域实际数值模拟软件的研制中也得到了初步应用, 支撑4款软件热点数值计算子程序平均性能提升164%.

图表 | 参考文献 | 相关文章 | 多维度评价
二维球坐标系中子输运方程的一种并行SN算法
蔡颖, 张存波, 刘旭, 范征锋, 刘元元, 徐小文, 张爱清
计算物理    2022, 39 (2): 143-152.   DOI: 10.19596/j.cnki.1001-246x.8381
摘要402)   HTML237)    PDF (5045KB)(1258)   

针对二维球坐标系下中子输运方程的SN算法, 提出基于(单元, 方向)二元组的有向图模型, 在已有的基于有向图的并行流水线算法基础上, 设计粒度可控多级并行SN算法。其中, 采用区域分解和并行流水线相结合的方式挖掘空间-角度方向的并行度, 提出能群流水并行方法, 并通过设置合适的流水线粒度来平衡有向图调度、通信和空闲等待开销。实验结果表明: 该算法可以有效地求解二维球坐标系下的中子输运方程。在某国产并行机1920核上, 对于96万网格、60个方向、24能群、数十亿自由度的典型中子输运问题, 获得了71%的并行效率。

图表 | 参考文献 | 相关文章 | 多维度评价
面向结构网格自适应并行计算的矩形区域求差集快速算法
刘旭, 徐小文, 张爱清
计算物理    2017, 34 (5): 563-573.  
摘要567)   HTML0)    PDF (3124KB)(1347)   
结构网格自适应程序需要使用矩形区域求差集算法计算网格层间数据依赖关系和网格层嵌套关系.原有的矩形区域求差集算法时间复杂度较高,成为该类应用大规模并行计算可扩展性能瓶颈.本文利用分而治之的方法,构造近似线性时间复杂度的矩形区域求差集快速算法,并利用区域分解实现该算法的并行计算.分别针对规则矩形区域和多层自适应网格的非规则矩形区域求差集问题,验证该算法的效率.结果表明,该算法具有近似线性计算复杂度,对于大规模计算问题,加速效果显著.
参考文献 | 相关文章 | 多维度评价
面向结构网格并行应用的一类快速通信算法
刘旭, 张爱清, 肖丽, 莫则尧
计算物理    2012, 29 (1): 58-64.  
摘要435)      PDF (4602KB)(1116)   
通信算法需要在相邻子区域间传输数据.通过求解子区域间的相交问题可以寻找相邻区域.针对子区域的求交问题,基于区间树,结合结构网格应用的特点,构造近似线性时间复杂度的算法.数值实验表明该算法具有较高的计算效率和可扩展性,能够支持百万量级矩形子区域的并行计算.
相关文章 | 多维度评价
二维多群辐射输运程序LARED-R-1的并行化
张爱清, 莫则尧
计算物理    2007, 24 (2): 146-152.  
摘要287)      PDF (424KB)(1187)   
利用有向图描述数据依赖关系,应用已有的并行流水线通量扫描算法,实现基于非协调网格的二维辐射输运程序LARED-R-1的并行化.同时,采用消息缓冲技术提高并行程序的性能.经测试,对于典型的问题规模(100群、3800个网格单元、40个方向),在某并行机的64个和128个处理器上,并行程序分别获得80%和53%的并行效率.
相关文章 | 多维度评价