期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
LBM伪势MRT三维模型GPU并行计算的性能优化
彭浩, 单鸣雷, 朱昌平, 姚澄
计算物理    2018, 35 (5): 554-562.   DOI: 10.19596/j.cnki.1001-246x.7698
摘要543)   HTML0)    PDF (3508KB)(1537)   
格子Boltzmann方法伪势模型算法中的格点间计算未完全局部化,因此在并行计算时需要更多次的全局内存读写、使用更多数量的寄存器和线程同步操作,从而导致GPU并行计算效率下降.本文针对伪势模型并行计算的局限性,基于三维十五速格子结构的多松弛时间伪势模型,以气液相分离为算例,通过合并访问的方式提高全局内存的读写效率;并提出一种"定向转移"算法,提高格子边界格点获取邻居格点数据的效率;最后探索不同资源分配中各种因素对计算效率的影响,总结最优资源分配的方法.
参考文献 | 相关文章 | 多维度评价