Please wait a minute...

过刊目录

    2024年, 第41卷, 第1期
    刊出日期:2024-01-25
    上一期    下一期

    目录         面向超级计算机的性能优化技术与数值并行算法专刊   
    全选选: 隐藏/显示图片
    目录
    目录
    2024, 41(1): 0-0. 
    摘要 ( )   PDF(368KB) ( )  
     
    主编寄语
    江松
    2024, 41(1): 1-1. 
    摘要 ( )   HTML ( )   PDF(550KB) ( )  
    面向超级计算机的性能优化技术与数值并行算法专刊
    卷首语
    莫则尧
    2024, 41(1): 2-2. 
    摘要 ( )   HTML ( )   PDF(588KB) ( )  
    围炉对谈: 性能优化的个性与共性
    莫则尧, 王龙, 刘杰, 谭光明, 刘伟峰, 喻之斌, 翟季冬, 杨海龙, 徐小文
    2024, 41(1): 3-8.  DOI: 10.19596/j.cnki.1001-246x.8818
    摘要 ( )   HTML ( )   PDF(658KB) ( )  

    2022年12月12日, 第八届高性能计算中间件技术研讨会(HPCMid22)成功召开。HPCMid (会议网址: http://www.caep-scns.ac.cn/HPCMid.php)每年举办一次, 面向科学与工程计算数值模拟应用在当前及下一代超级计算机上面临的挑战, 围绕高性能计算中间件关键技术, 邀请相关学者报告最新研究进展并探讨未来发展趋势。第八届研讨会以"适配新型体系结构的性能优化技术"为主题, 聚焦后摩尔时代新型体系结构为科学与工程计算带来的机遇与挑战, 探讨新型体系结构下可移植性能优化技术的发展趋势。本届研讨会的专家座谈(Panel Session)环节由莫则尧研究员和徐小文研究员共同主持, 邀请了王龙、刘杰、谭光明、刘伟峰、喻之斌5位来自高校、科研院所、企业的专家围绕"性能优化: 个性vs共性"这一主题开展了深入的讨论与交流, 翟季冬、杨海龙等多位专家也参与了讨论。专家们针对性能优化技术的研究现状与发展趋势、面临的问题与挑战以及人才培养等方面发表了许多有启发性的观点。《计算物理》编辑部特将本次讨论整理后发表, 以飨读者。限于篇幅, 略有删节。

    天河超算系统并行算法库
    刘杰, 石永振, 杨博, 张翔, 陈新海, 张华健, 郭晓威, 李胜国, 李润华, 彭晋韬, 肖调杰, 陈旭光, 张庆阳, 李彪, 冷灿, 李翊谁, 王庆林
    2024, 41(1): 9-21.  DOI: 10.19596/j.cnki.1001-246x.8784
    摘要 ( )   HTML ( )   PDF(7923KB) ( )  

    国防科技大学研制的天河超算系统7次荣登世界超算TOP500排行榜第一名。面对高效能发挥超算系统性能的实际需求, 天河团队抽取大型科学与工程计算中的共性核心计算方法, 根据天河超算系统的特点设计与实现了可扩展并行算法, 研制了天河超算系统并行算法库, 是天河超算系统应用支撑环境的重要组成部分。本文首先对天河超算系统的发展历程和系统结构等内容进行回顾; 随后, 对网格处理算法库、偏微分方程离散求解算法库、矩阵计算算法库、粒子输运计算库、聚合通信算法库以及深度学习算法库等并行算法库的架构、功能以及性能进行重点介绍; 最后, 对天河超算系统上典型应用软件的简要总结显示: 并行算法库可有效支撑典型应用软件的快速开发与性能优化。

    适用于申威众核架构的稀疏矩阵-矩阵乘法
    刘侃, 杨磊, 薛巍, 陈文光
    2024, 41(1): 22-32.  DOI: 10.19596/j.cnki.1001-246x.8766
    摘要 ( )   HTML ( )   PDF(8404KB) ( )  

    本文提出新一代申威众核架构上稀疏通用矩阵-矩阵乘法(SpGEMM)的并行算法swSpGEMM。设计轻量级并行任务划分有效地应对了矩阵非零元分布引起的负载不均衡问题; 针对累加过程中的不规则访存和指令流水低效问题, 设计了分层稀疏累加器, 在不同输入特征下高效利用申威从核层次化内存, 且减少了整数查找中的指令间依赖, 更有效地发挥硬件的计算能力。SuiteSparse稀疏矩阵测试集中较大规模输入矩阵上, swSpGEMM的性能相比Intel Skylake双CPU上的MKL和NVIDIA A100上的cuSPARSE分别加速了21.1%和95.3%。

    稀疏矩阵向量乘的自动调优
    杜臻, 谭光明
    2024, 41(1): 33-39.  DOI: 10.19596/j.cnki.1001-246x.8763
    摘要 ( )   HTML ( )   PDF(4372KB) ( )  

    分析稀疏矩阵向量乘(SpMV)程序优化的难点, 介绍两个自动调优的代表性工作: 基于预实现模板的SMAT和从头设计程序的AlphaSparse。详细介绍了它们的设计思路、实现细节、测试结果以及各自的优缺点。最后, 对SpMV自动调优的发展趋势进行了分析和预测。

    异步感知的异构高性能计算机性能预测方法
    金煜阳, 马子轩, 翟季冬
    2024, 41(1): 40-51.  DOI: 10.19596/j.cnki.1001-246x.8759
    摘要 ( )   HTML ( )   PDF(5225KB) ( )  

    针对异步策略设计难的问题, 提出面向异构超级计算机的高效异步性能预测方法, 解耦异步与同步执行的性能, 通过层次化建模等技术实现快速精确的性能预测, 指导异步策略设计与性能优化。在国产神威异构高性能计算机上, 以高性能计算领域典型应用为例, 验证所提出建模方法的准确性和高效性。实验结果表明: 本方法平均预测精度达到96.61%, 预测效率在毫秒级。

    SEMD:一种面向实际数值模拟软件的跨平台自动性能优化编程工具
    张鹏, 张爱清, 莫则尧, 王景焘
    2024, 41(1): 52-63.  DOI: 10.19596/j.cnki.1001-246x.8777
    摘要 ( )   HTML ( )   PDF(14870KB) ( )  

    针对手工软件性能优化缺乏可复用性和可移植性的问题, 设计实现一种面向实际数值模拟软件的跨平台自动性能优化编程工具SEMD (Single element-based computing multiple data)。SEMD采用数值模拟领域基于网格的高层语义对数值计算循环进行抽象, 完全屏蔽底层硬件特征和性能优化实现, 使得基于其编写的数值计算子程序能够自动实现跨平台性能可移植。典型算例测试结果显示: 在X86、ARM、GPU三种不同架构的处理器上, SEMD的整体性能优化效果超过国际上的同类产品。此外, SEMD在结构、流体、电磁等领域实际数值模拟软件的研制中也得到了初步应用, 支撑4款软件热点数值计算子程序平均性能提升164%.

    特征修正并行预条件算法框架
    徐小文, 莫则尧, 胡少亮, 安恒斌
    2024, 41(1): 64-74.  DOI: 10.19596/j.cnki.1001-246x.8787
    摘要 ( )   HTML ( )   PDF(9899KB) ( )  

    针对实际应用中稀疏线性解法器计算复杂度偏离线性扩展的瓶颈问题, 提出特征修正预条件算法统一框架, 通过凝练物理特征中影响算法效率的代数特征, 结合多层次特征分析, 构造特征修正组件。通过几类典型特征修正预条件算法及应用成效, 展示了该框架的有效性。

    辐射扩散方程的非线性迭代方法
    安恒斌, 莫则尧
    2024, 41(1): 75-86.  DOI: 10.19596/j.cnki.1001-246x.8765
    摘要 ( )   HTML ( )   PDF(1439KB) ( )  

    为了提高Newton方法和Picard方法求解辐射扩散方程组的健壮性和收敛速度, 介绍应用这两类方法求解辐射扩散方程组的几方面工作, 包括迭代初值的选取、迭代过程物理约束的处理、Picard迭代过程与Anderson加速的结合以及针对Anderson加速方法的改进等。通过应用相关的处理和改进策略, 两类方法可有效应用于非线性辐射扩散方程的求解。

    多群辐射扩散问题特征驱动的并行AMG法
    舒适, 岳孝强, 何剑萌, 徐小文, 莫则尧
    2024, 41(1): 87-97.  DOI: 10.19596/j.cnki.1001-246x.8768
    摘要 ( )   HTML ( )   PDF(1141KB) ( )  

    对求解多群辐射扩散(MGRD)方程组的大规模离散系统的已有快速算法进行分类, 给出相应的综述。基于近年来所设计的关于并行代数多重网格(AMG)方面的工作, 形成基于物理量的近似Schur补型与基于物理和代数特征的组合型预条件算法和理论框架, 并对这些工作在该框架下的要素进行了刻画。利用上述框架, 设计一种具有基本逼近性和低计算复杂度的近似Schur补型预条件子, 并建立相应的谱等价理论; 对比数值实验表明: 新预条件子具有更好的稳健性和计算效率。最后提出需要进一步解决的若干问题。

    面向渗流力学应用特征的预条件方法
    冯春生, 李仕哲, 刘生豪, 张晨松, 赵梨
    2024, 41(1): 98-109.  DOI: 10.19596/j.cnki.1001-246x.8791
    摘要 ( )   HTML ( )   PDF(1481KB) ( )  

    渗流力学模型由多个偏微分方程非线性耦合而成。在不同的应用问题中, 渗流力学问题的特性并不完全相同, 相应的求解方法也不相同。本文以油气藏开发中的典型数学模型为例, 介绍多孔介质中的多相多组分渗流力学方程的数学形式、应用特征以及其离散线性方程组的高效求解方法, 特别是一些常用的预条件方法。此外, 对标准算例进行适当的修改, 对部分预条件方法的共享内存并行效率进行了测试。

    应用特征驱动的并行数值代数解法器JPSOL
    胡少亮, 徐小文, 安恒斌, 徐然, 范荣红
    2024, 41(1): 110-121.  DOI: 10.19596/j.cnki.1001-246x.8771
    摘要 ( )   HTML ( )   PDF(14507KB) ( )  

    介绍JPSOL (J Parallel Solver Library for Numerical Algebra Problems)的软件架构、矩阵向量数据结构、三类算法库(线性、非线性和特征值)及领域专用解法器, 然后通过基本迭代法的测试结果说明其高可扩展并行性, 最后通过几类典型实际应用, 展示应用效果和健壮性。

    三温能量方程离散线性系统的两层迭代算法收敛因子估计及特征分析
    郝悦, 黄思路, 徐小文
    2024, 41(1): 122-130.  DOI: 10.19596/j.cnki.1001-246x.8767
    摘要 ( )   HTML ( )   PDF(1918KB) ( )  

    基于代数多重网格(AMG)方法的理论框架, 详细分析基于物理量粗化的两层迭代方法(PCTL)算法的具体收敛性质, 刻画算法收敛因子的合理上界, 为PCTL算法提供理论保证。进一步深入分析影响PCTL算法收敛速度的代数特征, 如对角占优性和耦合强度, 为PCTL算法的应用和算法调优提供了理论指导。

    量子计算加速的解法器算法及应用综述
    许康, 李泽阳, 郭竹丰, 沈颖童, 王威, 缑敏辉, 王子正, 王玉坤, 刘伟峰
    2024, 41(1): 131-150.  DOI: 10.19596/j.cnki.1001-246x.8778
    摘要 ( )   HTML ( )   PDF(1957KB) ( )  

    量子计算作为一种基于量子力学原理的全新计算模型, 具有强大的并行性和潜在的颠覆性影响力, 为解决复杂问题提供了新的思路。本文的主要目标是对量子计算在大规模科学与工程计算领域中数值计算问题的解法器算法和应用进行综述。重点介绍量子计算在线性方程组、特征值问题、微分方程、哈密顿量与图计算、量子机器学习、量子解法器平台以及实际数值模拟等领域的具体应用。针对不同的数值计算问题, 详细讨论当前主流的量子计算算法, 并总结近年来国内外相关算法的研究进展。最后, 对量子计算在数值计算求解相关研究方向的未来发展趋势进行展望。

分享到: