期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
多群辐射扩散问题特征驱动的并行AMG法
舒适, 岳孝强, 何剑萌, 徐小文, 莫则尧
计算物理    2024, 41 (1): 87-97.   DOI: 10.19596/j.cnki.1001-246x.8768
摘要61)   HTML3)    PDF (1141KB)(275)   

对求解多群辐射扩散(MGRD)方程组的大规模离散系统的已有快速算法进行分类, 给出相应的综述。基于近年来所设计的关于并行代数多重网格(AMG)方面的工作, 形成基于物理量的近似Schur补型与基于物理和代数特征的组合型预条件算法和理论框架, 并对这些工作在该框架下的要素进行了刻画。利用上述框架, 设计一种具有基本逼近性和低计算复杂度的近似Schur补型预条件子, 并建立相应的谱等价理论; 对比数值实验表明: 新预条件子具有更好的稳健性和计算效率。最后提出需要进一步解决的若干问题。

图表 | 参考文献 | 相关文章 | 多维度评价
辐射扩散方程的非线性迭代方法
安恒斌, 莫则尧
计算物理    2024, 41 (1): 75-86.   DOI: 10.19596/j.cnki.1001-246x.8765
摘要79)   HTML8)    PDF (1439KB)(297)   

为了提高Newton方法和Picard方法求解辐射扩散方程组的健壮性和收敛速度, 介绍应用这两类方法求解辐射扩散方程组的几方面工作, 包括迭代初值的选取、迭代过程物理约束的处理、Picard迭代过程与Anderson加速的结合以及针对Anderson加速方法的改进等。通过应用相关的处理和改进策略, 两类方法可有效应用于非线性辐射扩散方程的求解。

图表 | 参考文献 | 相关文章 | 多维度评价
特征修正并行预条件算法框架
徐小文, 莫则尧, 胡少亮, 安恒斌
计算物理    2024, 41 (1): 64-74.   DOI: 10.19596/j.cnki.1001-246x.8787
摘要46)   HTML0)    PDF (9899KB)(202)   

针对实际应用中稀疏线性解法器计算复杂度偏离线性扩展的瓶颈问题, 提出特征修正预条件算法统一框架, 通过凝练物理特征中影响算法效率的代数特征, 结合多层次特征分析, 构造特征修正组件。通过几类典型特征修正预条件算法及应用成效, 展示了该框架的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价
SEMD:一种面向实际数值模拟软件的跨平台自动性能优化编程工具
张鹏, 张爱清, 莫则尧, 王景焘
计算物理    2024, 41 (1): 52-63.   DOI: 10.19596/j.cnki.1001-246x.8777
摘要47)   HTML4)    PDF (14870KB)(243)   

针对手工软件性能优化缺乏可复用性和可移植性的问题, 设计实现一种面向实际数值模拟软件的跨平台自动性能优化编程工具SEMD (Single element-based computing multiple data)。SEMD采用数值模拟领域基于网格的高层语义对数值计算循环进行抽象, 完全屏蔽底层硬件特征和性能优化实现, 使得基于其编写的数值计算子程序能够自动实现跨平台性能可移植。典型算例测试结果显示: 在X86、ARM、GPU三种不同架构的处理器上, SEMD的整体性能优化效果超过国际上的同类产品。此外, SEMD在结构、流体、电磁等领域实际数值模拟软件的研制中也得到了初步应用, 支撑4款软件热点数值计算子程序平均性能提升164%.

图表 | 参考文献 | 相关文章 | 多维度评价
围炉对谈: 性能优化的个性与共性
莫则尧, 王龙, 刘杰, 谭光明, 刘伟峰, 喻之斌, 翟季冬, 杨海龙, 徐小文
计算物理    2024, 41 (1): 3-8.   DOI: 10.19596/j.cnki.1001-246x.8818
摘要96)   HTML7)    PDF (658KB)(352)   

2022年12月12日, 第八届高性能计算中间件技术研讨会(HPCMid22)成功召开。HPCMid (会议网址: http://www.caep-scns.ac.cn/HPCMid.php)每年举办一次, 面向科学与工程计算数值模拟应用在当前及下一代超级计算机上面临的挑战, 围绕高性能计算中间件关键技术, 邀请相关学者报告最新研究进展并探讨未来发展趋势。第八届研讨会以"适配新型体系结构的性能优化技术"为主题, 聚焦后摩尔时代新型体系结构为科学与工程计算带来的机遇与挑战, 探讨新型体系结构下可移植性能优化技术的发展趋势。本届研讨会的专家座谈(Panel Session)环节由莫则尧研究员和徐小文研究员共同主持, 邀请了王龙、刘杰、谭光明、刘伟峰、喻之斌5位来自高校、科研院所、企业的专家围绕"性能优化: 个性vs共性"这一主题开展了深入的讨论与交流, 翟季冬、杨海龙等多位专家也参与了讨论。专家们针对性能优化技术的研究现状与发展趋势、面临的问题与挑战以及人才培养等方面发表了许多有启发性的观点。《计算物理》编辑部特将本次讨论整理后发表, 以飨读者。限于篇幅, 略有删节。

参考文献 | 相关文章 | 多维度评价
卷首语
莫则尧
计算物理    2024, 41 (1): 2-2.  
摘要27)   HTML4)    PDF (588KB)(203)   
参考文献 | 相关文章 | 多维度评价
系统级封装应用中时谐Maxwell方程大规模计算的求解算法:现状与挑战
胡少亮, 徐小文, 郑宇腾, 赵振国, 王卫杰, 徐然, 安恒斌, 莫则尧
计算物理    2021, 38 (2): 131-145.   DOI: 10.19596/j.cnki.1001-246x.8231
摘要291)   HTML45)    PDF (3944KB)(1188)   
系统级封装(SiP)是当前电子学系统设计的主流技术途径,数值模拟是进行系统级封装(SiP)设计的主要手段。由于系统级封装应用特有的复杂性,现有的求解时谐Maxwell方程离散系统的算法面临很大的挑战,成为制约该类应用大规模数值模拟效率的瓶颈。本文综述系统级封装应用时谐Maxwell方程解法器求解算法,针对典型实际模型,评估现有算法的现状和面临的挑战,分析应用特征对算法计算能力的影响,并在现有算法的基础上提出一种可行的预条件算法策略。
参考文献 | 相关文章 | 多维度评价
计算电磁学及其在复杂电磁环境数值模拟中的应用和发展趋势
周海京, 刘阳, 李瀚宇, 董烨, 廖成, 董志伟, 莫则尧
计算物理    2014, 31 (4): 379-389.  
摘要441)      PDF (1859KB)(1454)   
概述计算电磁学的发展历程及其数值方法,并从学术研究、商业软件以及专用软件三个层次论述国内外研究的最新进展.结合复杂电磁环境的应用介绍复杂电磁环境数值模拟平台的研究现状,最后提出未来发展趋势的几点设想.
相关文章 | 多维度评价
基于JASMIN的地下水流大规模并行数值模拟
程汤培, 莫则尧, 邵景力
计算物理    2013, 30 (3): 317-325.  
摘要415)      PDF (1499KB)(890)   
针对具有精细网格剖分、长时间跨度特征的地下水流模拟中计算时间长、存储开销大等瓶颈问题,基于MODFLOW三维非稳定流计算方法,提出基于网格片的核心算法以及基于影像区的通信机制,并在JASMIN框架上研制了大规模地下水流并行数值模拟程序JOGFLOW.通过河南郑州市中牟县雁鸣湖水源地地下水流的模拟,对程序正确性和性能进行了验证;通过建立一个具有精细网格剖分的假想地下水概念模型对可扩展性进行测试.相对于32核的并行程序,在512以及1 024个处理机上的并行效率分别可达77.2%和67.5%.数值模拟结果表明,JOGFLOW具有较好的计算性能与可扩展性,能够有效使用数百上千计算核心,支持千万量级以上网格剖分的地下水流模型的大规模并行计算.
相关文章 | 多维度评价
BNCT治疗规划系统MCDB算法及测试
李刚, 邓力, 陈朝斌, 叶涛, 莫则尧
计算物理    2012, 29 (5): 721-726.  
摘要288)      PDF (1665KB)(874)   
给出BNCT治疗计划系统软件MCDB的算法及测试结果,通过使用材料矩阵描述BNCT的网格模型,配合快速径迹算法和计数矩阵,进行粒子输运模拟及计数,模拟结果显示,MCDB的计算精度与MCNP相当,计算速度较MCNP提高3.1~3.4倍.MCDB模拟1 000万粒子的时间不足2个CPU小时,可保证大部分网格剂量误差在5%以内,基本上达到了BNCT临床要求,可用于30 kW的医院中子照射器的临床治疗.
相关文章 | 多维度评价
自适应结构网格上扩散方程隐式时间积分算法及其应用
徐小文, 莫则尧, 刘青凯, 安恒斌
计算物理    2012, 29 (5): 684-692.  
摘要245)      PDF (3169KB)(816)   
提出一种自适应结构网格(SAMR)上求解扩散方程的隐式时间积分算法.该算法从粗网格到细网格逐层进行时间积分,通过多层迭代同步校正保证粗细界面的流连续和计算区域的扩散平衡.分析算法复杂度,并给出评估算法低复杂度的准则.典型算例表明,相对于一致加密情形,本文算法能够在保持相同计算精度的前提下,大幅度降低网格规模和计算量,且具有低复杂度.将算法应用于辐射流体力学数值模拟中非线性扩散方程组求解,相对于一致加密网格,SAMR计算将计算量下降一个量级以上,计算效率提高33.2倍.
相关文章 | 多维度评价
JFNK方法迭代过程与物理约束
安恒斌, 莫则尧
计算物理    2012, 29 (5): 654-660.  
摘要409)      PDF (769KB)(930)   
对Jacobian-free Newton-Krylov(JFNK)方法迭代过程进行分析,通过在迭代过程中吸收物理约束信息,对JFNK方法进行改进.改进后的JFNK方法迭代过程中的迭代序列总是满足物理约束,克服了迭代过程中可能出现的非物理现象.采用改进之后的算法求解二维三温能量方程,可以保证在迭代过程中不会出现负温度问题,使JFNK方法的健壮性得到提高.
相关文章 | 多维度评价
二维三温辐射扩散方程组两层预条件子的自适应求解
周志阳, 徐小文, 舒适, 冯春生, 莫则尧
计算物理    2012, 29 (4): 475-483.  
摘要255)      PDF (1392KB)(834)   
针对实际应用中若干典型三温线性系统,分析求解二维三温辐射扩散方程离散线性系统的代数两层预条件子(PCTL)的算法效率.结果表明,PCTL的算法效率与三个温度之间的耦合强度以及单温子系统对角占优性强弱程度有很大关系.为此,通过刻画三温线性系统的耦合强度和单温子系统对角占优性特征,提出一种PCTL中子系统的自适应求解算法.数值结果表明,可以显著改善PCTL的算法效率.对于实际数值模拟应用中37个典型三温线性系统,相对于经典AMG算法,算法整体加速2.5倍.数值实验表明算法具有很强的鲁棒性.
相关文章 | 多维度评价
面向结构网格并行应用的一类快速通信算法
刘旭, 张爱清, 肖丽, 莫则尧
计算物理    2012, 29 (1): 58-64.  
摘要408)      PDF (4602KB)(763)   
通信算法需要在相邻子区域间传输数据.通过求解子区域间的相交问题可以寻找相邻区域.针对子区域的求交问题,基于区间树,结合结构网格应用的特点,构造近似线性时间复杂度的算法.数值实验表明该算法具有较高的计算效率和可扩展性,能够支持百万量级矩形子区域的并行计算.
相关文章 | 多维度评价
二维保单调保守恒插值算子
马利斌, 胡晓燕, 莫则尧
计算物理    2010, 27 (5): 633-640.  
摘要243)      PDF (479KB)(771)   
基于一个一维保单调保守恒插值算子,利用不完全双二次插值提出一个二维保单调保守恒插值算子.从插值逼近角度,通过几个数值实验验证该插值算子有效.用得到的二维插值算子作为结构网格自适应加密(structured adaptive mesh refinement,SAMR)算法中的细化插值算子,求解几个二维Euler方程数值例子,结果表明,提出的二维插值算子有效.
相关文章 | 多维度评价
一种基于信息测度的科学数据集序列约减方法
吴国清, 莫则尧, 陈虹
计算物理    2009, 26 (6): 831-836.  
摘要216)      PDF (387KB)(758)   
提出一种基于信息测度的数据集序列约减方法,研究如何从序列中抽样出具有较小相关性,同时不丢失具有重要物理特征的数据集.方法具有普适性,应用于激光与等离子体相互作用模拟程序的结果数据中,减少数据集间的相关性和信息冗余度,单个数据集的平均信息量较原数据集序列增加30%左右.
相关文章 | 多维度评价
一个新的保单调保守恒插值算子
马利斌, 胡晓燕, 莫则尧
计算物理    2009, 26 (6): 821-830.  
摘要249)      PDF (394KB)(742)   
提出一个保守恒保单调的PQIM插值算子,论证该算子的收敛阶、保守恒性与保单调性,通过数值实验,证明该算子能有效地抑制可能由插值引起的振荡.
相关文章 | 多维度评价
基于内存约束的一维负载平衡方法及其应用
刘旭, 莫则尧, 曹小林
计算物理    2009, 26 (2): 184-190.  
摘要231)      PDF (369KB)(776)   
在内存约束的条件下,提出一种新的一维负载平衡方法.该方法是一个迭代法,严格的理论证明表明,它可以线性收敛到最优剖分.针对典型的负载不平衡模型和三维分子动力学问题,1 024个处理器上的实际应用表明,该方法可以取得较好的效果.
相关文章 | 多维度评价
求解二维三温辐射扩散方程组的一种代数两层迭代方法
徐小文, 莫则尧, 安恒斌
计算物理    2009, 26 (1): 1-8.  
摘要333)      PDF (465KB)(958)   
在二维三温辐射扩散方程离散代数方程组的求解中,由于光子、电子和离子温度之间存在耦合关系,而且三个温度在同种介质中有不同的扩散性质,使得经典的代数多重网格(AMG)方法难以直接应用.基于特殊粗化策略,在粗网格层解除了这种耦合关系,得到一种代数两层网格方法,而粗网格方程由经典AMG方法求解.将这一算法具体应用于JFNK(Jacobian自由的Newton-Krylov)框架中预处理方程的求解,并基于该框架求解二维三温辐射扩散方程组.数值结果显示了算法的可扩展性和健壮性.
相关文章 | 多维度评价
激光自聚焦和成丝模拟中的并行计算方法
陈军, 莫则尧, 郑春阳, 李斌
计算物理    2008, 25 (2): 127-132.  
摘要281)      PDF (364KB)(776)   
已编制完成三维非线性流体力学与激光传播耦合并行模拟程序,用以研究高强度激光在稀疏等离子体中的自聚焦和成丝不稳定性形成机制.介绍该三维并行程序中所使用的数值方法和并行算法.
相关文章 | 多维度评价
并行代数多重网格算法可扩展性能分析
徐小文, 莫则尧
计算物理    2007, 24 (4): 387-394.  
摘要337)      PDF (507KB)(1256)   
对当今求解大型稀疏线性代数方程组最有效的迭代方法之一——代数多重网格(AMG)算法的并行计算进行可扩展性能分析.给出一套并行计算可扩展性能分析方法,用于分析和指导并行迭代算法及实现技术的设计与优化并应用于并行AMG算法.分析表明,网格算子的平均模式大小和迭代过程的算法效率分别制约了AMG算法启动阶段和迭代求解阶段并行性能的发挥,成为该类算法急需解决的两个关键问题.
相关文章 | 多维度评价
二维多群辐射输运程序LARED-R-1的并行化
张爱清, 莫则尧
计算物理    2007, 24 (2): 146-152.  
摘要251)      PDF (424KB)(792)   
利用有向图描述数据依赖关系,应用已有的并行流水线通量扫描算法,实现基于非协调网格的二维辐射输运程序LARED-R-1的并行化.同时,采用消息缓冲技术提高并行程序的性能.经测试,对于典型的问题规模(100群、3800个网格单元、40个方向),在某并行机的64个和128个处理器上,并行程序分别获得80%和53%的并行效率.
相关文章 | 多维度评价
二维三温热传导方程求解中的非线性迭代初值选取
安恒斌, 莫则尧, 徐小文
计算物理    2007, 24 (2): 127-133.  
摘要223)      PDF (369KB)(832)   
由于二维三温热传导方程具有很强的非线性特性,因此采用全隐格式对该方程离散后,所得非线性代数方程组的求解将变得非常困难.针对二维三温热传导方程离散所得非线性代数方程组的迭代求解,提出了一种有效的选取初值的方法.对两种不同性质的介质进行数值实验,结果表明,所设计的初值选取方法不仅大大提高了计算效率,而且能够降低非线性解法器对时间步长的影响.
相关文章 | 多维度评价
基于“块-单元”数据结构的分子动力学并行计算
曹小林, 莫则尧, 张景琳, 陈其峰
计算物理    2004, 21 (5): 377-385.  
摘要208)      PDF (581KB)(875)   
开发了一种基于"块-单元"数据结构的可扩展并行算法,以实现大规模、非均匀分子动力学模拟.它采用空间填充曲线将三维区域分解转换为一维负载平衡问题,然后用基于实测的多层均权法求解,以保持处理机间负载均衡.在一个MPP并行机的500个CPU上,模拟包含2.1×108个粒子的三维金属微喷射模型,该算法获得了420倍的加速比.
相关文章 | 多维度评价
基于几何区域分解的三维输运问题并行迭代算法
阳述林, 莫则尧, 沈隆钧
计算物理    2004, 21 (1): 1-9.  
摘要249)      PDF (272KB)(789)   
对三维直角坐标下的输运隐式差分方程,研究了基于几何区域分解的并行迭代算法,给出了串、并行迭代误差估计.并对相关数值结果进行了分析、比较.
相关文章 | 多维度评价
二维电磁等离子体粒子云网格法并行程序的可扩展性分析
陈军, 莫则尧, 袁国兴, 李晓梅
计算物理    2001, 18 (4): 366-371.  
摘要198)      PDF (269KB)(693)   
大规模并行处理的发展要求并行应用程序具有良好的可扩展性.以二维电磁等离子体粒子云并行程序为例,描述了近优可扩展性分析的应用.在已知小规模系统性能的基础上,通过近优可扩展性分析,可以得到更大规模的系统在多少台处理机上运行更为"合理"的信息.
相关文章 | 多维度评价
二维分子动力学程序(MDP)的并行与优化
莫则尧, 张景琳
计算物理    2000, 17 (S1): 193-198.   DOI: 10.3969/j.issn.1001-246X.2000.01.032
摘要256)      PDF (201KB)(1032)   
基于消息传递并行程序设计平台MPI,结合当前微处理器的高性能特征,探讨了二维分子动力学数值模拟程序的优化和并行,且具体应用到高速碰撞物理模型问题。其中,串行优化的性能提高了两倍,并行效率在由 8台高性能微机构成的微机机群上,均大于90%。
相关文章 | 多维度评价
二维三温流体力学数值模拟程序的并行化
莫则尧, 符尚武, 沈隆钧
计算物理    2000, 17 (6): 625-632.  
摘要236)      PDF (191KB)(869)   
基于消息传递,通过设计并行算法和组织网格划分,实现了二维三温流体力学Lagrange数值模拟串行程序(Lared-Ⅰ)的并行化。结合物理问题特性和程序的执行特征,设计了动态负载平衡方法,进一步提高并行计算性能。并给出两个并行计算环境上的数值实验结果。
相关文章 | 多维度评价
高维预条件子的填充技术
刘兴平, 莫则尧, 彭力田
计算物理    2000, 17 (5): 476-482.  
摘要195)      PDF (153KB)(720)   
给出了高维问题差分离散后形成的大型稀疏线性代数方程组预条件子的填充技术,讨论了填充与加速效率、计算量的关系。并把这一技术在实际应用问题中进行检验。
相关文章 | 多维度评价
二维等离子体模拟粒子云网格方法的并行计算与性能分析
莫则尧, 许林宝, 张宝琳, 沈隆钧
计算物理    1999, 16 (5): 496-504.  
摘要266)      PDF (532KB)(947)   
在共享和分布式存储两种并行计算环境下,组织了二维等离子体模拟粒子云网格法程序(2DCIC)的并行计算。首先,通过分析串行算法和2DCIC程序的单机执行特征,设计了并行算法和实现策略;然后,基于共享存储和消息传递两种并行程序设计方式,在四种共享和分布式存储并行机上,组织了具体的并行计算,对性能结果进行了详细的比较分析,获得了若干重要结论。
相关文章 | 多维度评价