计算物理 ›› 2023, Vol. 40 ›› Issue (5): 570-582.DOI: 10.19596/j.cnki.1001-246x.8656
收稿日期:
2022-10-18
出版日期:
2023-09-25
发布日期:
2023-11-02
通讯作者:
安恒斌
作者简介:
胡毅,男,硕士研究生,研究方向为并行数值算法,E-mail: huyi20@gscaep.ac.cn
基金资助:
Yi HU1(), Hengbin AN2,3,*(
)
Received:
2022-10-18
Online:
2023-09-25
Published:
2023-11-02
Contact:
Hengbin AN
摘要:
针对电子连续性方程的离散代数方程组, 对离散线性系统的矩阵进行分析, 得到矩阵的三类特点; 针对大规模电子连续性方程的离散方程组, 采用预处理Krylov子空间方法进行求解, 并比较和分析几类预处理方法的效果。结果表明: 代数多重网格(AMG)预处理Krylov子空间方法在求解离散电子连续性方程方面非常有效。开展AMG预处理Krylov子空间方法求解离散电子连续性方程的大规模并行可扩展性测试, 比较和分析了AMG方法中三类关键算法参数的选取。
胡毅, 安恒斌. 半导体器件数值模拟中电子连续性方程的求解算法[J]. 计算物理, 2023, 40(5): 570-582.
Yi HU, Hengbin AN. Algorithms for Solving Electronic Continuity Equation in Numerical Simulation of Semiconductor Devices[J]. Chinese Journal of Computational Physics, 2023, 40(5): 570-582.
DOF | Precondition | GMRES | BiCGSTAB | |||||
NIT | Pre/s | Total/s | NIT | Pre/s | Total/s | |||
15 729 | NONE | 474 | 4.66 | * | * | * | ||
15 729 | JAC | 221 | 1.46 | 2.83 | 215 | 1.81 | 2.24 | |
15 729 | BJAC | 217 | 2.02 | 3.42 | 169 | 2.48 | 2.88 | |
15 729 | ASM | 215 | 1.98 | 3.34 | 158 | 2.37 | 2.76 | |
15 729 | AMG | 12 | 0.31 | 0.57 | 7 | 0.18 | 0.22 | |
62 177 | NONE | 851 | 37.84 | * | * | * | ||
62 177 | JAC | 440 | 4.65 | 15.57 | 415 | 5.78 | 6.87 | |
62 177 | BJAC | 438 | 4.93 | 15.78 | 335 | 7.39 | 8.35 | |
62 177 | ASM | 409 | 5.51 | 15.08 | 330 | 9.99 | 11.00 | |
62 177 | AMG | 11 | 0.63 | 0.69 | 7 | 0.34 | 0.37 | |
231 361 | NONE | * | * | * | * | * | * | |
231 361 | JAC | 937 | 19.57 | 93.41 | 884 | 24.77 | 52.18 | |
231 361 | BJAC | 925 | 22.31 | 94.08 | 792 | 25.12 | 54.29 | |
231 361 | ASM | 862 | 24.42 | 85.59 | 599 | 29.34 | 47.75 | |
231 361 | AMG | 12 | 1.53 | 1.61 | 7 | 0.72 | 0.80 |
表1 准一维PN结模型计算结果(24核)
Table 1 Calculation results of quasi-one-dimensional PN junction model (24 cores)
DOF | Precondition | GMRES | BiCGSTAB | |||||
NIT | Pre/s | Total/s | NIT | Pre/s | Total/s | |||
15 729 | NONE | 474 | 4.66 | * | * | * | ||
15 729 | JAC | 221 | 1.46 | 2.83 | 215 | 1.81 | 2.24 | |
15 729 | BJAC | 217 | 2.02 | 3.42 | 169 | 2.48 | 2.88 | |
15 729 | ASM | 215 | 1.98 | 3.34 | 158 | 2.37 | 2.76 | |
15 729 | AMG | 12 | 0.31 | 0.57 | 7 | 0.18 | 0.22 | |
62 177 | NONE | 851 | 37.84 | * | * | * | ||
62 177 | JAC | 440 | 4.65 | 15.57 | 415 | 5.78 | 6.87 | |
62 177 | BJAC | 438 | 4.93 | 15.78 | 335 | 7.39 | 8.35 | |
62 177 | ASM | 409 | 5.51 | 15.08 | 330 | 9.99 | 11.00 | |
62 177 | AMG | 11 | 0.63 | 0.69 | 7 | 0.34 | 0.37 | |
231 361 | NONE | * | * | * | * | * | * | |
231 361 | JAC | 937 | 19.57 | 93.41 | 884 | 24.77 | 52.18 | |
231 361 | BJAC | 925 | 22.31 | 94.08 | 792 | 25.12 | 54.29 | |
231 361 | ASM | 862 | 24.42 | 85.59 | 599 | 29.34 | 47.75 | |
231 361 | AMG | 12 | 1.53 | 1.61 | 7 | 0.72 | 0.80 |
DOF | Precondition | GMRES | BiCGSTAB | |||||
NIT | Pre/s | Total/s | NIT | Pre/s | Total/s | |||
231 361 | NONE | * | * | * | * | * | * | |
231 361 | JAC | * | * | * | * | * | * | |
231 361 | BJAC | 1 128 | 13.13 | 45.98 | 909 | 24.15 | 30.86 | |
231 361 | ASM | 1 022 | 12.09 | 44.13 | 878 | 23.70 | 30.19 | |
231 361 | AMG | 21 | 0.81 | 0.87 | 16 | 1.03 | 1.08 | |
923 521 | NONE | * | * | * | * | * | * | |
923 521 | JAC | * | * | * | * | * | * | |
923 521 | BJAC | * | * | * | * | * | * | |
923 521 | ASM | * | * | * | * | * | * | |
923 521 | AMG | 21 | 1.46 | 1.55 | 16 | 1.78 | 1.95 | |
3 690 241 | NONE | * | * | * | * | * | * | |
3 690 241 | JAC | * | * | * | * | * | * | |
3 690 241 | BJAC | * | * | * | * | * | * | |
3 690 241 | ASM | * | * | * | * | * | * | |
3 690 241 | AMG | 21 | 3.00 | 3.25 | 16 | 3.92 | 4.05 |
表2 二维PN结模型计算结果(240核)
Table 2 Calculation results of two-dimensional PN junction model (240 cores)
DOF | Precondition | GMRES | BiCGSTAB | |||||
NIT | Pre/s | Total/s | NIT | Pre/s | Total/s | |||
231 361 | NONE | * | * | * | * | * | * | |
231 361 | JAC | * | * | * | * | * | * | |
231 361 | BJAC | 1 128 | 13.13 | 45.98 | 909 | 24.15 | 30.86 | |
231 361 | ASM | 1 022 | 12.09 | 44.13 | 878 | 23.70 | 30.19 | |
231 361 | AMG | 21 | 0.81 | 0.87 | 16 | 1.03 | 1.08 | |
923 521 | NONE | * | * | * | * | * | * | |
923 521 | JAC | * | * | * | * | * | * | |
923 521 | BJAC | * | * | * | * | * | * | |
923 521 | ASM | * | * | * | * | * | * | |
923 521 | AMG | 21 | 1.46 | 1.55 | 16 | 1.78 | 1.95 | |
3 690 241 | NONE | * | * | * | * | * | * | |
3 690 241 | JAC | * | * | * | * | * | * | |
3 690 241 | BJAC | * | * | * | * | * | * | |
3 690 241 | ASM | * | * | * | * | * | * | |
3 690 241 | AMG | 21 | 3.00 | 3.25 | 16 | 3.92 | 4.05 |
θ | GMRES | BiCGSTAB | |||||
NIT | Pre/s | Total/s | NIT | Pre/s | Total/s | ||
0.10 | 22 | 9.98 | 10.87 | 15 | 14.02 | 14.32 | |
0.25 | 22 | 9.91 | 10.84 | 16 | 13.99 | 13.41 | |
0.50 | 44 | 23.95 | 26.47 | 31 | 32.15 | 33.37 | |
0.75 | 64 | 33.60 | 38.03 | 54 | 56.17 | 55.18 | |
0.90 | 114 | 58.21 | 70.29 | 151 | 152.66 | 154.83 |
表3 AMG中强连通阈值对求解时间的影响
Table 3 Influence of threshold theta on solution time in AMG
θ | GMRES | BiCGSTAB | |||||
NIT | Pre/s | Total/s | NIT | Pre/s | Total/s | ||
0.10 | 22 | 9.98 | 10.87 | 15 | 14.02 | 14.32 | |
0.25 | 22 | 9.91 | 10.84 | 16 | 13.99 | 13.41 | |
0.50 | 44 | 23.95 | 26.47 | 31 | 32.15 | 33.37 | |
0.75 | 64 | 33.60 | 38.03 | 54 | 56.17 | 55.18 | |
0.90 | 114 | 58.21 | 70.29 | 151 | 152.66 | 154.83 |
Coarsening | Gmres | BiCGSTAB | |||||
NIT | Pre/s | Total/s | NIT | Pre/s | Total/s | ||
Falgout | 22 | 9.91 | 10.84 | 15 | 12.92 | 14.10 | |
CJLP | 25 | 15.06 | 16.13 | 17 | 19.45 | 20.67 | |
PMIS | 113 | 36.51 | 48.25 | 77 | 50.43 | 52.56 | |
HMIS | 40 | 15.84 | 17.98 | 27 | 20.57 | 21.87 |
表4 AMG中粗化算法对求解时间的影响
Table 4 Influence of coarsening on solution time in AMG
Coarsening | Gmres | BiCGSTAB | |||||
NIT | Pre/s | Total/s | NIT | Pre/s | Total/s | ||
Falgout | 22 | 9.91 | 10.84 | 15 | 12.92 | 14.10 | |
CJLP | 25 | 15.06 | 16.13 | 17 | 19.45 | 20.67 | |
PMIS | 113 | 36.51 | 48.25 | 77 | 50.43 | 52.56 | |
HMIS | 40 | 15.84 | 17.98 | 27 | 20.57 | 21.87 |
Smoother | GMRES | BiCGSTAB | |||||
NIT | Pre/s | Total/s | NIT | Pre/s | Total/s | ||
SOR | 25 | 10.94 | 12.00 | 16 | 14.34 | 15.23 | |
Jacobi | 28 | 12.22 | 12.46 | 20 | 16.32 | 17.36 | |
SGS | 22 | 9.91 | 10.84 | 15 | 12.77 | 13.16 |
表5 AMG中光滑算法对求解时间的影响
Table 5 Influence of smoother on solution time in AMG
Smoother | GMRES | BiCGSTAB | |||||
NIT | Pre/s | Total/s | NIT | Pre/s | Total/s | ||
SOR | 25 | 10.94 | 12.00 | 16 | 14.34 | 15.23 | |
Jacobi | 28 | 12.22 | 12.46 | 20 | 16.32 | 17.36 | |
SGS | 22 | 9.91 | 10.84 | 15 | 12.77 | 13.16 |
Cores(N) | GMRES | BiCGSTAB | |||||||||
NIT | Pre/s | Total/s | SPDUP | ParEff/% | NIT | Pre/s | Total/s | SPDUP | ParEff/% | ||
48(2) | 21 | 50.04 | 54.60 | 1 | 100 | 15 | 65.81 | 67.56 | 1 | 100 | |
96(4) | 22 | 25.00 | 27.27 | 2.00 | 100 | 15 | 32.67 | 33.57 | 2.01 | 100 | |
192(8) | 23 | 12.95 | 14.11 | 3.86 | 97 | 16 | 16.56 | 17.04 | 3.96 | 99 | |
240(10) | 23 | 9.86 | 10.88 | 5.01 | 100 | 16 | 13.27 | 13.67 | 4.94 | 99 | |
480(20) | 22 | 5.99 | 6.53 | 8.36 | 84 | 17 | 8.06 | 8.29 | 8.16 | 81 | |
720(30) | 24 | 4.42 | 4.80 | 11.37 | 76 | 17 | 5.82 | 5.99 | 11.27 | 75 | |
840(35) | 24 | 4.00 | 4.34 | 12.58 | 72 | 18 | 5.08 | 5.25 | 12.86 | 73 |
表6 AMG预处理的两类Krylov子空间方法求解电子连续性方程的强并行可扩展性
Table 6 Strong parallel scalability of two kinds of AMG preconditioned Krylov subspace methods for solving electronic continuity equation
Cores(N) | GMRES | BiCGSTAB | |||||||||
NIT | Pre/s | Total/s | SPDUP | ParEff/% | NIT | Pre/s | Total/s | SPDUP | ParEff/% | ||
48(2) | 21 | 50.04 | 54.60 | 1 | 100 | 15 | 65.81 | 67.56 | 1 | 100 | |
96(4) | 22 | 25.00 | 27.27 | 2.00 | 100 | 15 | 32.67 | 33.57 | 2.01 | 100 | |
192(8) | 23 | 12.95 | 14.11 | 3.86 | 97 | 16 | 16.56 | 17.04 | 3.96 | 99 | |
240(10) | 23 | 9.86 | 10.88 | 5.01 | 100 | 16 | 13.27 | 13.67 | 4.94 | 99 | |
480(20) | 22 | 5.99 | 6.53 | 8.36 | 84 | 17 | 8.06 | 8.29 | 8.16 | 81 | |
720(30) | 24 | 4.42 | 4.80 | 11.37 | 76 | 17 | 5.82 | 5.99 | 11.27 | 75 | |
840(35) | 24 | 4.00 | 4.34 | 12.58 | 72 | 18 | 5.08 | 5.25 | 12.86 | 73 |
1 |
DOI |
2 |
DOI |
3 |
|
4 |
DOI |
5 |
|
6 |
DOI |
7 |
|
8 |
|
9 |
|
10 |
|
11 |
王芹, 马召灿, 白石阳, 等. 三维半导体器件漂移扩散模型的并行有限元方法研究[J]. 数值计算与计算机应用, 2020, 41 (2): 85- 104.
|
12 |
|
13 |
DOI |
14 |
DOI |
15 |
|
16 |
|
17 |
|
18 |
BRIGGS W, HENSON V, McORMICK S. A multigrid tutorial[M]. SIAM, 2000.
|
19 |
DOI |
20 |
DOI |
21 |
贾晓伟. 面向半导体器件数值模拟的漂移扩散方程高效求解方法研究[D]. 北京: 中国工程物理研究院, 2022.
|
22 |
DOI |
23 |
DOI |
24 |
张家驹. M矩阵的一些性质[J]. 数学年刊: 中文版, 1980, 1 (1): 46- 55.
|
25 |
DOI |
26 |
|
27 |
谷同祥, 安恒斌, 刘兴平, 等. 迭代方法和预处理技术(上册)[M]. 北京: 科学出版社, 2015.
|
28 |
DOI |
29 |
DOI |
30 |
张志刚, 刘长军, 黄卡玛, 等. 一维PN结二极管稳态模型的数值模拟[J]. 洛阳工业高等专科学校学报, 2005, 15 (1): 28- 30.
|
31 |
|
32 |
|
33 |
DOI |
34 |
FALGOUT R, YANG U. HYPRE: A library of high performance preconditioners[C]//International Conference on Computational Science Heidelberg: Springer, 2002: 632-641.
|
35 |
BALAY S, ABHYANKAR S, Adams M, et al. PETSc users manual[R]. Argonne National Lab (ANL), Argonne, IL(United States), 2019.
|
[1] | 胡少亮, 许开龙, 徐然, 刘再刚, 徐小文, 安恒斌, 范荣红, 汪振宇, 王伟. 求解压力Poisson方程的混合粗化代数多重网格算法[J]. 计算物理, 2023, 40(5): 527-534. |
[2] | 李凌霄, 翟传磊, 谢辉, 施意. 一种求解三维热辐射输运方程的整体预处理迭代方法及并行计算[J]. 计算物理, 2021, 38(3): 269-279. |
[3] | 李凌霄. 不可压缩流基于块预处理的并行有限元计算[J]. 计算物理, 2018, 35(2): 151-160. |
[4] | 刘中玉, 张明锋, 郑冠男, 杨国伟. 基于预处理HLLEW格式的全速域数值算法[J]. 计算物理, 2016, 33(3): 273-282. |
[5] | 杨容, 杭旭登, 翟传磊, 李双贵, 齐进, 李敬宏. 激光光路追踪模拟中的高精度求交算法[J]. 计算物理, 2015, 32(2): 207-213. |
[6] | 冯涛, 蔚喜军, 安恒斌, 张荣培. 预处理JFNK方法求解非平衡辐射扩散方程组[J]. 计算物理, 2013, 30(4): 483-490. |
[7] | 李超龙, 石海泉, 吕建钦. 双圆筒加速透镜中强流束传输的模拟[J]. 计算物理, 2013, 30(3): 403-408. |
[8] | 甘文彪, 周洲. 基于层流动能湍流模型的数值模拟方法[J]. 计算物理, 2013, 30(2): 169-179. |
[9] | 安恒斌, 莫则尧. JFNK方法迭代过程与物理约束[J]. 计算物理, 2012, 29(5): 654-660. |
[10] | 周志阳, 徐小文, 舒适, 冯春生, 莫则尧. 二维三温辐射扩散方程组两层预条件子的自适应求解[J]. 计算物理, 2012, 29(4): 475-483. |
[11] | 杨帅帅, 孙玉发. 应用AWE技术和等效偶极子法快速计算目标宽带RCS[J]. 计算物理, 2012, 29(3): 406-410. |
[12] | 成杰, 张林波. 一种可扩展的三维半导体器件并行数值模拟算法[J]. 计算物理, 2012, 29(3): 439-448. |
[13] | 韩忠华, 宋文萍, 乔志德. 一种隐式预处理方法及其在定常和非定常流动数值模拟中的应用[J]. 计算物理, 2009, 26(5): 679-684. |
[14] | 范宣华, 吴瑞安, 郝志明, 何颖波. 基于Tahoe框架的某夹具并行计算[J]. 计算物理, 2009, 26(5): 699-702. |
[15] | 袁光伟, 杭旭登, 盛志强, 岳晶岩. 辐射扩散计算方法若干研究进展[J]. 计算物理, 2009, 26(4): 475-500. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||
版权所有 © 《计算物理》编辑部
地址:北京市海淀区丰豪东路2号 邮编:100094 E-mail:jswl@iapcm.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发