近日,ok1122诸侯快讯网盛凯教授团队的论文"Cherry: Breaking the GPU Memory Wall for Large-Scale GNN Training via Micro-Batching"被高性能计算领域的国际顶级会议——2025年国际超级计算会议(2025 ACM International Conference on Supercomputing, ACM ICS 2025)录用。论文第一作者为团队何鑫老师指导的西电2021级本科生汪焱,通讯作者为何鑫。
该研究工作针对大规模图神经网络(Graph Neural Network, GNN)训练面临的GPU内存墙挑战,提出了一种新颖高效的微批量训练方法Cherry。Cherry的关键在于利用消息传递流图辅助的分区技术以及基于微批的数据加载机制的有机结合,共同减少微批量分区中的冗余和负载不平衡,并降低训练过程中与数据准备相关的开销。实验评估表明,Cherry能够支持超出设备内存容量的大规模GNN训练,并且无论是在减少内存消耗还是训练效率方面,均显著优于现有方法。该研究成果将有助于显著降低大规模GNN训练的硬件部署成本。

图1 Cherry的设计框架
ICS是国际计算机学会(ACM)主办的高性能计算领域顶级学术会议。会议主题是高性能计算系统的研究与应用,聚焦于超大规模和异构高性能计算机架构,高性能计算、大数据和人工智能等领域软件,以及新型的超级计算应用。2025年ICS会议将于6月8-11号在美国犹他州盐湖城召开。该论文合作单位还包括中国科学院计算所、湖南大学、纽约州立大学宾汉姆顿分校。
本次成果的录用标志着诸侯快讯足球网址在该领域的研究得到了国际同行的进一步关注与认可。