科学家开发多GPU结构晶圆计算机 希望突破数据链路瓶颈
伊利诺伊大学香槟分校和加州大学洛杉机分校的科研团队正在研发一台晶圆级计算机架构,其目标旨在构建多GPU芯片以芯片数据内连连接(interconnect)的高效计算系统,实现内部数据互连的速率和能效,突破数据链路导致的性能瓶颈。
超级计算机中通常将一个任务应用负载分散至单独的印刷电路板的多GPU计算单元,这些GPU单元通过长途数据链路相互通信。数据链路成为了主要的瓶颈,因为它们的传输速度比芯片内部数据互连要慢得多。
此外,“芯片和印刷电路板的存在机械性的不匹配”。意味着这些处理器必须包含在芯片封装内,但这些封装在输入/输出次数上是有限制的。
综合起来数据链路就会产生显著的性能瓶颈。如果是在理想情况下,多GPU模块间数据通信可以和芯片内部数据互连的速度/能效一样高。
一种方法是把所有GPU都整合入同一块硅晶圆的计算机,并且用芯片内连连接它们。从规模生产上来看这种方法不现实,如果整合40个GPU入一个晶圆就足够制造工艺灾难,很难保证如此规模项目中不存在某个制造瑕疵。
研究团队采用了另一种方法:他们称之为硅互连结构(SiIF)的新技术,使用通过质量测试的标准GPU芯片,并用紧密集成的SiIF结构更好地连接它们。从工程师的角度来看,其性能就是一个巨型的怪兽级GPU芯片,而非40个独立GPU芯片并联计算。
这种多GPU性能怪物的模拟计算速度提升19倍,并将综合能耗和信号延迟的削减了140多倍。
伊利诺伊的计算机工程助理教授Rakesh Kumar和他的同事们已经开始建造晶圆级原型,有望在2月IEEE国际高性能计算机体系结构研讨会上展示他们的研究成果。