期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
几类典型应用的代数多重网格算法并行可扩展瓶颈分析
毛润彰, 杜皓, 田鸿运, 黄思路, 张鹏, 徐小文
计算物理    2024, 41 (4): 403-417.   DOI: 10.19596/j.cnki.1001-246x.8737
摘要243)   HTML13)    PDF (26445KB)(354)   

对于大规模稀疏线性代数方程组,代数多重网格(AMG)是具有最优计算复杂度的求解算法,但由于其算法流程复杂,导致难以取得理想的并行可扩展性能,难以定位和分析其并行可扩展瓶颈。通过分析AMG算法的性能骨架和通信模式,归纳了三类可扩展性能瓶颈,并引入稀疏矩阵通信域的概念来刻画稀疏模式对并行通信性能的影响。针对辐射流体力学、结构力学、航空发动机三类实际应用的6个具有不同稀疏模式特征的典型算例,实现了多粒度并行可扩展性能瓶颈的定位与分析,总结了未来AMG并行性能优化方向。

图表 | 参考文献 | 相关文章 | 多维度评价
三温能量方程离散线性系统的两层迭代算法收敛因子估计及特征分析
郝悦, 黄思路, 徐小文
计算物理    2024, 41 (1): 122-130.   DOI: 10.19596/j.cnki.1001-246x.8767
摘要78)   HTML2)    PDF (1918KB)(688)   

基于代数多重网格(AMG)方法的理论框架, 详细分析基于物理量粗化的两层迭代方法(PCTL)算法的具体收敛性质, 刻画算法收敛因子的合理上界, 为PCTL算法提供理论保证。进一步深入分析影响PCTL算法收敛速度的代数特征, 如对角占优性和耦合强度, 为PCTL算法的应用和算法调优提供了理论指导。

图表 | 参考文献 | 相关文章 | 多维度评价
应用特征驱动的并行数值代数解法器JPSOL
胡少亮, 徐小文, 安恒斌, 徐然, 范荣红
计算物理    2024, 41 (1): 110-121.   DOI: 10.19596/j.cnki.1001-246x.8771
摘要210)   HTML7)    PDF (14507KB)(634)   

介绍JPSOL (J Parallel Solver Library for Numerical Algebra Problems)的软件架构、矩阵向量数据结构、三类算法库(线性、非线性和特征值)及领域专用解法器, 然后通过基本迭代法的测试结果说明其高可扩展并行性, 最后通过几类典型实际应用, 展示应用效果和健壮性。

图表 | 参考文献 | 相关文章 | 多维度评价
多群辐射扩散问题特征驱动的并行AMG法
舒适, 岳孝强, 何剑萌, 徐小文, 莫则尧
计算物理    2024, 41 (1): 87-97.   DOI: 10.19596/j.cnki.1001-246x.8768
摘要186)   HTML5)    PDF (1141KB)(818)   

对求解多群辐射扩散(MGRD)方程组的大规模离散系统的已有快速算法进行分类, 给出相应的综述。基于近年来所设计的关于并行代数多重网格(AMG)方面的工作, 形成基于物理量的近似Schur补型与基于物理和代数特征的组合型预条件算法和理论框架, 并对这些工作在该框架下的要素进行了刻画。利用上述框架, 设计一种具有基本逼近性和低计算复杂度的近似Schur补型预条件子, 并建立相应的谱等价理论; 对比数值实验表明: 新预条件子具有更好的稳健性和计算效率。最后提出需要进一步解决的若干问题。

图表 | 参考文献 | 相关文章 | 多维度评价
特征修正并行预条件算法框架
徐小文, 莫则尧, 胡少亮, 安恒斌
计算物理    2024, 41 (1): 64-74.   DOI: 10.19596/j.cnki.1001-246x.8787
摘要245)   HTML4)    PDF (9899KB)(570)   

针对实际应用中稀疏线性解法器计算复杂度偏离线性扩展的瓶颈问题, 提出特征修正预条件算法统一框架, 通过凝练物理特征中影响算法效率的代数特征, 结合多层次特征分析, 构造特征修正组件。通过几类典型特征修正预条件算法及应用成效, 展示了该框架的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价
围炉对谈: 性能优化的个性与共性
莫则尧, 王龙, 刘杰, 谭光明, 刘伟峰, 喻之斌, 翟季冬, 杨海龙, 徐小文
计算物理    2024, 41 (1): 3-8.   DOI: 10.19596/j.cnki.1001-246x.8818
摘要223)   HTML12)    PDF (658KB)(900)   

2022年12月12日, 第八届高性能计算中间件技术研讨会(HPCMid22)成功召开。HPCMid (会议网址: http://www.caep-scns.ac.cn/HPCMid.php)每年举办一次, 面向科学与工程计算数值模拟应用在当前及下一代超级计算机上面临的挑战, 围绕高性能计算中间件关键技术, 邀请相关学者报告最新研究进展并探讨未来发展趋势。第八届研讨会以"适配新型体系结构的性能优化技术"为主题, 聚焦后摩尔时代新型体系结构为科学与工程计算带来的机遇与挑战, 探讨新型体系结构下可移植性能优化技术的发展趋势。本届研讨会的专家座谈(Panel Session)环节由莫则尧研究员和徐小文研究员共同主持, 邀请了王龙、刘杰、谭光明、刘伟峰、喻之斌5位来自高校、科研院所、企业的专家围绕"性能优化: 个性vs共性"这一主题开展了深入的讨论与交流, 翟季冬、杨海龙等多位专家也参与了讨论。专家们针对性能优化技术的研究现状与发展趋势、面临的问题与挑战以及人才培养等方面发表了许多有启发性的观点。《计算物理》编辑部特将本次讨论整理后发表, 以飨读者。限于篇幅, 略有删节。

参考文献 | 相关文章 | 多维度评价
求解压力Poisson方程的混合粗化代数多重网格算法
胡少亮, 许开龙, 徐然, 刘再刚, 徐小文, 安恒斌, 范荣红, 汪振宇, 王伟
计算物理    2023, 40 (5): 527-534.   DOI: 10.19596/j.cnki.1001-246x.8662
摘要364)   HTML22)    PDF (4455KB)(1094)   

针对复杂流动中Navier-Stokes(N-S)方程SIMPLE算法导出的压力Poisson(泊松)离散线性系统, 提出一类基于混合粗化的代数多重网格(AMG)算法。该算法采用一类非光滑聚类粗化和经典C/F粗化结合的方式构造网格层次结构, 希望在不影响收敛性的情况下, 减少AMG算法的启动开销。通过航空发动机燃烧室复杂流动数值模拟应用验证了该算法的有效性。结果表明: 对于典型算例, 相对于经典AMG算法, 该算法可以获得78%的加速。

图表 | 参考文献 | 相关文章 | 多维度评价
二维球坐标系中子输运方程的一种并行SN算法
蔡颖, 张存波, 刘旭, 范征锋, 刘元元, 徐小文, 张爱清
计算物理    2022, 39 (2): 143-152.   DOI: 10.19596/j.cnki.1001-246x.8381
摘要402)   HTML237)    PDF (5045KB)(1258)   

针对二维球坐标系下中子输运方程的SN算法, 提出基于(单元, 方向)二元组的有向图模型, 在已有的基于有向图的并行流水线算法基础上, 设计粒度可控多级并行SN算法。其中, 采用区域分解和并行流水线相结合的方式挖掘空间-角度方向的并行度, 提出能群流水并行方法, 并通过设置合适的流水线粒度来平衡有向图调度、通信和空闲等待开销。实验结果表明: 该算法可以有效地求解二维球坐标系下的中子输运方程。在某国产并行机1920核上, 对于96万网格、60个方向、24能群、数十亿自由度的典型中子输运问题, 获得了71%的并行效率。

图表 | 参考文献 | 相关文章 | 多维度评价
系统级封装应用中时谐Maxwell方程大规模计算的求解算法:现状与挑战
胡少亮, 徐小文, 郑宇腾, 赵振国, 王卫杰, 徐然, 安恒斌, 莫则尧
计算物理    2021, 38 (2): 131-145.   DOI: 10.19596/j.cnki.1001-246x.8231
摘要416)   HTML45)    PDF (3944KB)(1582)   
系统级封装(SiP)是当前电子学系统设计的主流技术途径,数值模拟是进行系统级封装(SiP)设计的主要手段。由于系统级封装应用特有的复杂性,现有的求解时谐Maxwell方程离散系统的算法面临很大的挑战,成为制约该类应用大规模数值模拟效率的瓶颈。本文综述系统级封装应用时谐Maxwell方程解法器求解算法,针对典型实际模型,评估现有算法的现状和面临的挑战,分析应用特征对算法计算能力的影响,并在现有算法的基础上提出一种可行的预条件算法策略。
参考文献 | 相关文章 | 多维度评价
面向结构网格自适应并行计算的矩形区域求差集快速算法
刘旭, 徐小文, 张爱清
计算物理    2017, 34 (5): 563-573.  
摘要567)   HTML0)    PDF (3124KB)(1347)   
结构网格自适应程序需要使用矩形区域求差集算法计算网格层间数据依赖关系和网格层嵌套关系.原有的矩形区域求差集算法时间复杂度较高,成为该类应用大规模并行计算可扩展性能瓶颈.本文利用分而治之的方法,构造近似线性时间复杂度的矩形区域求差集快速算法,并利用区域分解实现该算法的并行计算.分别针对规则矩形区域和多层自适应网格的非规则矩形区域求差集问题,验证该算法的效率.结果表明,该算法具有近似线性计算复杂度,对于大规模计算问题,加速效果显著.
参考文献 | 相关文章 | 多维度评价
SAMR网格上扩散方程有限体格式的逼近性与两层网格算法
舒适, 岳孝强, 周志阳, 徐小文
计算物理    2014, 31 (4): 390-402.  
摘要417)      PDF (1353KB)(1214)   
针对结构自适应加密网格(SAMR)上扩散方程的求解,分析几种有限体格式的逼近性,同时设计和分析一种两层网格算法.首先,讨论一种常见的守恒型有限体格式,并给出网格加密区域和细化/粗化插值算子的条件;接着,通过在粗细界面附近引入辅助三角形单元,消除粗细界面处的非协调单元,设计了一种保对称有限体元(SFVE)格式,分析表明,该格式具有更好的逼近性,且对网格加密区域和插值算子的限制更弱;最后,为SFVE格式构造一种两层网格(TL)算法,理论分析和数值实验表明该算法的一致收敛性.
相关文章 | 多维度评价
自适应结构网格上扩散方程隐式时间积分算法及其应用
徐小文, 莫则尧, 刘青凯, 安恒斌
计算物理    2012, 29 (5): 684-692.  
摘要289)      PDF (3169KB)(1316)   
提出一种自适应结构网格(SAMR)上求解扩散方程的隐式时间积分算法.该算法从粗网格到细网格逐层进行时间积分,通过多层迭代同步校正保证粗细界面的流连续和计算区域的扩散平衡.分析算法复杂度,并给出评估算法低复杂度的准则.典型算例表明,相对于一致加密情形,本文算法能够在保持相同计算精度的前提下,大幅度降低网格规模和计算量,且具有低复杂度.将算法应用于辐射流体力学数值模拟中非线性扩散方程组求解,相对于一致加密网格,SAMR计算将计算量下降一个量级以上,计算效率提高33.2倍.
相关文章 | 多维度评价
二维三温辐射扩散方程组两层预条件子的自适应求解
周志阳, 徐小文, 舒适, 冯春生, 莫则尧
计算物理    2012, 29 (4): 475-483.  
摘要285)      PDF (1392KB)(1323)   
针对实际应用中若干典型三温线性系统,分析求解二维三温辐射扩散方程离散线性系统的代数两层预条件子(PCTL)的算法效率.结果表明,PCTL的算法效率与三个温度之间的耦合强度以及单温子系统对角占优性强弱程度有很大关系.为此,通过刻画三温线性系统的耦合强度和单温子系统对角占优性特征,提出一种PCTL中子系统的自适应求解算法.数值结果表明,可以显著改善PCTL的算法效率.对于实际数值模拟应用中37个典型三温线性系统,相对于经典AMG算法,算法整体加速2.5倍.数值实验表明算法具有很强的鲁棒性.
相关文章 | 多维度评价
一种求解流体力学方程组的自适应显式时间积分算法及其应用
刘青凯, 徐小文, 吴俊峰
计算物理    2011, 28 (2): 174-180.  
摘要437)      PDF (609KB)(1216)   
针对交替方向显式离散格式,提出一个基于结构网格局部加密技术(SAMR)的求解流体力学方程组的自适应时间积分算法;基于该算法,在JASMIN框架上研制多介质流体力学并行自适应数值模拟程序;在512个处理器上模拟惯性约束聚变中的二维内爆模型.数值模拟结果和并行性能分析显示了算法的正确性和并行实现的高效率.
相关文章 | 多维度评价
求解二维三温辐射扩散方程组的一种代数两层迭代方法
徐小文, 莫则尧, 安恒斌
计算物理    2009, 26 (1): 1-8.  
摘要365)      PDF (465KB)(1487)   
在二维三温辐射扩散方程离散代数方程组的求解中,由于光子、电子和离子温度之间存在耦合关系,而且三个温度在同种介质中有不同的扩散性质,使得经典的代数多重网格(AMG)方法难以直接应用.基于特殊粗化策略,在粗网格层解除了这种耦合关系,得到一种代数两层网格方法,而粗网格方程由经典AMG方法求解.将这一算法具体应用于JFNK(Jacobian自由的Newton-Krylov)框架中预处理方程的求解,并基于该框架求解二维三温辐射扩散方程组.数值结果显示了算法的可扩展性和健壮性.
相关文章 | 多维度评价
并行代数多重网格算法可扩展性能分析
徐小文, 莫则尧
计算物理    2007, 24 (4): 387-394.  
摘要395)      PDF (507KB)(1802)   
对当今求解大型稀疏线性代数方程组最有效的迭代方法之一——代数多重网格(AMG)算法的并行计算进行可扩展性能分析.给出一套并行计算可扩展性能分析方法,用于分析和指导并行迭代算法及实现技术的设计与优化并应用于并行AMG算法.分析表明,网格算子的平均模式大小和迭代过程的算法效率分别制约了AMG算法启动阶段和迭代求解阶段并行性能的发挥,成为该类算法急需解决的两个关键问题.
相关文章 | 多维度评价
二维三温热传导方程求解中的非线性迭代初值选取
安恒斌, 莫则尧, 徐小文
计算物理    2007, 24 (2): 127-133.  
摘要242)      PDF (369KB)(1201)   
由于二维三温热传导方程具有很强的非线性特性,因此采用全隐格式对该方程离散后,所得非线性代数方程组的求解将变得非常困难.针对二维三温热传导方程离散所得非线性代数方程组的迭代求解,提出了一种有效的选取初值的方法.对两种不同性质的介质进行数值实验,结果表明,所设计的初值选取方法不仅大大提高了计算效率,而且能够降低非线性解法器对时间步长的影响.
相关文章 | 多维度评价
结构三角网上抛物方程的有限差分三层交替方法
吕桂霞, 马富明, 徐小文
计算物理    2006, 23 (3): 295-302.  
摘要218)      PDF (270KB)(1146)   
讨论了在一类结构三角网上数值求解二维热传导方程的两类有限差分三层交替方法:带状交替(ABd:Alternating Band)方法和带状交替显-隐式(ABdE-I:Alternating Band Explicit-Implicit)方法.这两类方法不仅具有明显的并行性和良好的计算精度,而且理论分析表明它们都绝对稳定.
相关文章 | 多维度评价