对于大规模稀疏线性代数方程组,代数多重网格(AMG)是具有最优计算复杂度的求解算法,但由于其算法流程复杂,导致难以取得理想的并行可扩展性能,难以定位和分析其并行可扩展瓶颈。通过分析AMG算法的性能骨架和通信模式,归纳了三类可扩展性能瓶颈,并引入稀疏矩阵通信域的概念来刻画稀疏模式对并行通信性能的影响。针对辐射流体力学、结构力学、航空发动机三类实际应用的6个具有不同稀疏模式特征的典型算例,实现了多粒度并行可扩展性能瓶颈的定位与分析,总结了未来AMG并行性能优化方向。
基于代数多重网格(AMG)方法的理论框架, 详细分析基于物理量粗化的两层迭代方法(PCTL)算法的具体收敛性质, 刻画算法收敛因子的合理上界, 为PCTL算法提供理论保证。进一步深入分析影响PCTL算法收敛速度的代数特征, 如对角占优性和耦合强度, 为PCTL算法的应用和算法调优提供了理论指导。
介绍JPSOL (J Parallel Solver Library for Numerical Algebra Problems)的软件架构、矩阵向量数据结构、三类算法库(线性、非线性和特征值)及领域专用解法器, 然后通过基本迭代法的测试结果说明其高可扩展并行性, 最后通过几类典型实际应用, 展示应用效果和健壮性。
对求解多群辐射扩散(MGRD)方程组的大规模离散系统的已有快速算法进行分类, 给出相应的综述。基于近年来所设计的关于并行代数多重网格(AMG)方面的工作, 形成基于物理量的近似Schur补型与基于物理和代数特征的组合型预条件算法和理论框架, 并对这些工作在该框架下的要素进行了刻画。利用上述框架, 设计一种具有基本逼近性和低计算复杂度的近似Schur补型预条件子, 并建立相应的谱等价理论; 对比数值实验表明: 新预条件子具有更好的稳健性和计算效率。最后提出需要进一步解决的若干问题。
针对实际应用中稀疏线性解法器计算复杂度偏离线性扩展的瓶颈问题, 提出特征修正预条件算法统一框架, 通过凝练物理特征中影响算法效率的代数特征, 结合多层次特征分析, 构造特征修正组件。通过几类典型特征修正预条件算法及应用成效, 展示了该框架的有效性。
2022年12月12日, 第八届高性能计算中间件技术研讨会(HPCMid22)成功召开。HPCMid (会议网址: http://www.caep-scns.ac.cn/HPCMid.php)每年举办一次, 面向科学与工程计算数值模拟应用在当前及下一代超级计算机上面临的挑战, 围绕高性能计算中间件关键技术, 邀请相关学者报告最新研究进展并探讨未来发展趋势。第八届研讨会以"适配新型体系结构的性能优化技术"为主题, 聚焦后摩尔时代新型体系结构为科学与工程计算带来的机遇与挑战, 探讨新型体系结构下可移植性能优化技术的发展趋势。本届研讨会的专家座谈(Panel Session)环节由莫则尧研究员和徐小文研究员共同主持, 邀请了王龙、刘杰、谭光明、刘伟峰、喻之斌5位来自高校、科研院所、企业的专家围绕"性能优化: 个性vs共性"这一主题开展了深入的讨论与交流, 翟季冬、杨海龙等多位专家也参与了讨论。专家们针对性能优化技术的研究现状与发展趋势、面临的问题与挑战以及人才培养等方面发表了许多有启发性的观点。《计算物理》编辑部特将本次讨论整理后发表, 以飨读者。限于篇幅, 略有删节。
针对复杂流动中Navier-Stokes(N-S)方程SIMPLE算法导出的压力Poisson(泊松)离散线性系统, 提出一类基于混合粗化的代数多重网格(AMG)算法。该算法采用一类非光滑聚类粗化和经典C/F粗化结合的方式构造网格层次结构, 希望在不影响收敛性的情况下, 减少AMG算法的启动开销。通过航空发动机燃烧室复杂流动数值模拟应用验证了该算法的有效性。结果表明: 对于典型算例, 相对于经典AMG算法, 该算法可以获得78%的加速。
针对二维球坐标系下中子输运方程的SN算法, 提出基于(单元, 方向)二元组的有向图模型, 在已有的基于有向图的并行流水线算法基础上, 设计粒度可控多级并行SN算法。其中, 采用区域分解和并行流水线相结合的方式挖掘空间-角度方向的并行度, 提出能群流水并行方法, 并通过设置合适的流水线粒度来平衡有向图调度、通信和空闲等待开销。实验结果表明: 该算法可以有效地求解二维球坐标系下的中子输运方程。在某国产并行机1920核上, 对于96万网格、60个方向、24能群、数十亿自由度的典型中子输运问题, 获得了71%的并行效率。