2.1.2 系统级封装在高性能图像处理器与显存技术中的应用
GPU(Graphic Processing Unit,图形处理器)是显卡的核心组件之一,是一种特殊用途的CPU(Central Processing Unit,中央处理器)。GPU计算的任务基本是高度并行的,需要同时执行大量小型的数学计算。显卡性能由GPU芯片、显存带宽和显存容量这三要素决定,并且主要受到GPU芯片性能的影响,因此往往要求GPU有强大的并行计算能力,同时内存有更大的带宽和容量。
大带宽和大内存HBM非常适用于高性能显存,是在显存性能驱动下被开发出来的。3D堆叠的内存实现了大容量存储、大规模I/O端口,2.5D硅转接板的集成方式大大缩短了数据传输距离。显存容量的大小决定了显存临时存储数据的能力。带宽大小决定了数据交换的速率。较短的传输距离有效降低了数据交换带来的功耗。因此,大带宽和大内存HBM在显存方面的应用给高性能显卡带来了一次变革。
AMD在2015年推出的FURY系列GPU中使用了大带宽和大内存,可以说是显卡史上的一次重大突破。AMD与SK Hynix合作,通过4096位接口,基于GCN架构的GPU可提供大带宽和大内存HBM(4GB),首次实现了512Gbit/s的显存带宽。这是在图形处理产品中首次采用转接板、TSV和微凸点(Micro-Bumps)技术,从而在封装结构设计的角度上不断缩短内存堆栈和GPU之间的距离。大带宽和大内存HBM及中介层由此可以提供大于上一代GDDR5显存60%的带宽,同时实现每瓦性能是GDDR5每瓦性能的4倍。
图2-3所示为NVIDIA的GPU截面电镜照片。它是世界上首款AI超级计算及数据中心的GPU。NVIDIA的Tesla P100采用了芯片转接板键合基板(Chip on Wafer on Substrate,CoWoS)方案,集成了三星提供的第二代HBM内存。通过该方案,Tesla P100提升了计算性能,大幅缩短了数据密集型应用程序解决方案的计算时间。
图2-3 NVIDIA的GPU截面电镜照片