AI计算机虽然一直在进步,但都是小打小闹,经过这么多年的技术积累,Wafer Scale Engine芯片的出现就是代表在AI计算机领域从量变到质变的过程。为什么这么说呢?因为搭载Wafer Scale Engine芯片的CS-1实在是太强大了。
根据官方公布的信息显示,Wafer Scale Engine芯片基于台积电16nm工艺制造,核心面积超过了46225mm平方,是目前芯片面积最大的英伟达GPU的56.7倍,内部集成了1.2万亿个晶体管,同时有40万个核心。这个硬件的配置,完全把Wafer Scale Engine芯片推上了目前AI计算机能搭载芯片的顶峰。
但如果只有这些,那搭载Wafer Scale Engine芯片的CS-1或许还有些差强人意。毕竟芯片只是计算机整体的一部分,虽然很重要,但它并不是全部。所以除了搭载Wafer Scale Engine芯片之外,CS-1还有以下亮点。
首先,CS-1是一个单一的系统,跟以往的GPU群体相比,可以提供更多的计算性能,同时省去了集群搭建和管理的开销。从而大幅缩短项目的整体时间,提升人工智能的研究效率。
同时与其他系统相比,CS-1每个组件都专门针对人工智能工作优化,可以以更小的尺寸与更少的能耗提供更加强大的计算机性能。
综上,搭载Wafer Scale Engine芯片的CS-1无疑是目前世界上最为先进的AI计算机。毕竟不仅是芯片做到了前所未有的优化,而是针对计算机整体做出了升级。而且这些升级基本上可以说是目前世界上的顶尖技术。
Cerebras此前推出的全球最大AI芯片WSE基于台积电16nm工艺,核心面积超过46225mm2,是目前芯片面积最大的英伟达GPU的56.7倍。其内部集成了高达1.2万亿个晶体管,40万个核心,18Gigabytes的片上内存,内存带宽9 PByte/s,fabric带宽100 Pbit/s,)
WSE包含40万个AI优化的计算内核是稀疏线性代数核(Sparse Linear Algebra Cores, SLAC),具有灵活性、可编程性,并针对支持所有神经网络计算的稀疏线性代数进行了优化。SLAC的可编程性保证了内核能够在不断变化的机器学习领域运行所有的神经网络算法。
虽然,在人工智能计算中,芯片越大越好,更大的芯片处理信息更快,能在更短的时间内得到训练结果。但是,仅有强大的AI处理器性能还远不足够。像WSE这样的高级处理器必须与专用的软件相结合才能实现破纪录的性能。因此,Cerebras专门为这一巨型芯片开发了专门的CS-1系统和软件平台,各方面都为加速人工智能计算专门设计。
据介绍,CS-1系统只有15个标准机架高度,高约26 英寸(约 66 厘米),可以在一个机架中安装三套CS-1系统。一套CS-1系统的性能就相当于一个拥有1000颗英伟达V100的GPU的集群,并且CS-1所占的空间只有其1/40,功耗也只有其1/50。3 b9
Cerebras表示,与其他系统相比,CS-1的每一个组件都专门针对人工智能工作优化,可以以更小的尺寸和更少的能源消耗下提供更高的计算性能。
功耗及散热系统
作为全球最大、性能最强的AI芯片,WSE的功耗和发热也很大,再加上散热系统的功耗,这也使得整个CS-1系统的功耗进一步提升到了20千瓦。根据官方的数据显示,WSE芯片的功耗为15千瓦,专门用于散热子系统(包括风扇、水泵、导热排等等)的功耗为4千瓦,还有1千瓦损失在供电转换效率上。
整个CS-1系统通过机箱后面的12个电源连接接口获取电源,然后将电压从54V降低至0.8V,再将其传送至芯片。功率流过母板(而不是母板周围),然后流入处理器,而未指定数量的内核的各个区域各自接收自己所需的电源。Cerebras表示,晶圆级的WSE芯片保持了一致的功率传输,并且还实现了片上功率的精细化分配。很厉害