期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
适用于申威众核架构的稀疏矩阵-矩阵乘法
刘侃, 杨磊, 薛巍, 陈文光
计算物理    2024, 41 (1): 22-32.   DOI: 10.19596/j.cnki.1001-246x.8766
摘要177)   HTML8)    PDF (8404KB)(521)   

本文提出新一代申威众核架构上稀疏通用矩阵-矩阵乘法(SpGEMM)的并行算法swSpGEMM。设计轻量级并行任务划分有效地应对了矩阵非零元分布引起的负载不均衡问题; 针对累加过程中的不规则访存和指令流水低效问题, 设计了分层稀疏累加器, 在不同输入特征下高效利用申威从核层次化内存, 且减少了整数查找中的指令间依赖, 更有效地发挥硬件的计算能力。SuiteSparse稀疏矩阵测试集中较大规模输入矩阵上, swSpGEMM的性能相比Intel Skylake双CPU上的MKL和NVIDIA A100上的cuSPARSE分别加速了21.1%和95.3%。

图表 | 参考文献 | 相关文章 | 多维度评价
结构材料辐照损伤的分子动力学程序GPU并行化及优化
祁美玲, 杨琼, 王苍龙, 田园, 杨磊
计算物理    2017, 34 (4): 461-467.  
摘要624)   HTML0)    PDF (1870KB)(1403)   
基于NIVIDIA公司的CUDA架构对结构材料辐照损伤的分子动力学程序在单个GPU上进行并行化,并对影响程序运行效率的相关因素进行分析和测试.经过一系列优化,当粒子数为两百万时,对比单CPU的执行时间,优化后的GPU程序其双精度加速比可达112倍,单精度加速比达到了三百倍,为后续扩展多GPU结构材料辐照损伤的分子动力学程序奠定基础.
参考文献 | 相关文章 | 多维度评价
自然循环蒸汽发生器倒U型管内流动不稳定性判别准则
郝建立, 陈文振, 杨磊, 王少明
计算物理    2013, 30 (4): 515-519.  
摘要342)      PDF (723KB)(1091)   
针对自然循环蒸汽发生器倒U型管内流动不稳定的特点,利用无量纲分析方法建立管内流体控制方程.采用小扰动分析方法,得到倒U型管内流动不稳定的判别准则.通过对某型蒸汽发生器进行计算分析,获得判别准则随流体进口温度和弯管半径变化规律.计算结果表明:随着流体进口温度的升高,特征雷诺数增加,但是不同流体进口温度条件下特征雷诺数随弯管半径的变化规律不同.相对于流体进口温度,弯管半径对特征雷诺数的影响较小.所得结论为蒸汽发生器倒U型管内倒流管空间分布及倒流流量计算提供理论依据.
相关文章 | 多维度评价
托卡马克中快波电流驱动下全波方程的数值求解
刘燕, 龚学余, 杨磊, 彭晓炜, 尹岚
计算物理    2012, 29 (3): 375-382.  
摘要514)      PDF (380KB)(1440)   
用全波方法研究环形对称托卡马克等离子体中离子回旋频率范围内(ICRF)的快波电流驱动(FWCD)问题,考虑有限拉莫尔半径(FLR)效应和平行色散,建立全波计算的物理模型—全波方程,通过对全波方程的数值求解得到快波在等离子体中激发的电场强度分布.结果表明:快波可以传播到高温高密度等离子体的中心;快波在磁轴附近发生了模式转换;快波可以驱动中心的等离子体电流以改善等离子体的平衡位型;平行电场比垂直电场小三个数量级,通过垂直方向的回旋共振和平行方向的穿越期磁泵效应达到驱动电流的目的.
相关文章 | 多维度评价