对于大规模稀疏线性代数方程组,代数多重网格(AMG)是具有最优计算复杂度的求解算法,但由于其算法流程复杂,导致难以取得理想的并行可扩展性能,难以定位和分析其并行可扩展瓶颈。通过分析AMG算法的性能骨架和通信模式,归纳了三类可扩展性能瓶颈,并引入稀疏矩阵通信域的概念来刻画稀疏模式对并行通信性能的影响。针对辐射流体力学、结构力学、航空发动机三类实际应用的6个具有不同稀疏模式特征的典型算例,实现了多粒度并行可扩展性能瓶颈的定位与分析,总结了未来AMG并行性能优化方向。
针对手工软件性能优化缺乏可复用性和可移植性的问题, 设计实现一种面向实际数值模拟软件的跨平台自动性能优化编程工具SEMD (Single element-based computing multiple data)。SEMD采用数值模拟领域基于网格的高层语义对数值计算循环进行抽象, 完全屏蔽底层硬件特征和性能优化实现, 使得基于其编写的数值计算子程序能够自动实现跨平台性能可移植。典型算例测试结果显示: 在X86、ARM、GPU三种不同架构的处理器上, SEMD的整体性能优化效果超过国际上的同类产品。此外, SEMD在结构、流体、电磁等领域实际数值模拟软件的研制中也得到了初步应用, 支撑4款软件热点数值计算子程序平均性能提升164%.
针对高速公路车辆换道问题, 提出一个多车道车辆换道模型。利用支持向量机(SVM)在多维特征下二分类问题的优势, 将SVM和Lagrange坐标下的高阶守恒模型(CHO)结合, 通过全离散跟车模型生成原始数据, 采用SMOTE(Synthetic Minority Oversampling Technique)算法对数据进行预处理, 采用双指标评估度SVM进行训练, 建立多车道车辆换道仿真模型。仿真结果表明: 基于支持向量机和CHO模型的换道模型, 驾驶车能够就当前的驾驶环境, 准确地作出决策, 有效地模拟高速公路上真实的多车道驾驶情况。