面向新一代神威超级计算机的高效内存分配器
2021-11-17分类号:TP338.4
【部门】清华大学计算机科学与技术系
【摘要】随着应用程序规模的增大,应用程序对计算资源的需求也日益增加,超级计算机为满足这一需求提供了良好的平台.传统的超级计算机主要面向科学计算程序,而近年来应用的多样化对超级计算机的软硬件设计提出了新要求.该文在新一代神威超级计算机上发现了在动态运行模式下内存分配的性能问题,并针对神威的体系结构特征和应用特征,设计了高效的内存分配器——SWAlloc.实验结果表明:SWAlloc可以将超大规模机器学习训练框架八卦炉的内存分配速度提升至多75839倍;对随机生成的内存分配记录和标准测试程序集PARSEC中的内存分配记录的测试结果,验证了SWAlloc在不同应用上的通用性和高效性,可将神威超级计算机上PARSEC的内存分配效率提升至多51倍(平均提升36%).SWAlloc已经布署于新一代神威超级计算机上,并用于SWPytorch、SWTensor Flow等超大规模应用.
【关键词】内存分配 超级计算机 高性能计算 机器学习
【基金】国家自然科学基金项目(U20A20226)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递