在这种背景之下,加速计算给予了必需的计算能力与内存,其解决方案涵盖了硬件、软件和网络的组合。接着,我们会对常见的硬件加速器进行回顾与梳理,像 GPU、ASIC、TPU、FPGA 等这些。同时,也会对如 CUDA 等软件解决方案进行梳理。此外,还会对 PCIe、CXL、以太网等网络互联技术进行探讨。
硬件、软件和网络互联
摩尔定律终结了,这意味着 CPU 性能的增长开始放缓。于是,人们开始对当前价值 1 万亿美元的纯 CPU 服务器市场的未来发展产生疑问。随着对更强大的应用程序和系统的需求持续增加,传统的 CPU 难以与加速计算展开竞争。加速计算利用专用硬件来加速某些任务的执行,这些专用硬件包括 GPU、ASIC、TPU 和 FPGA 等,与传统 CPU 相比,它能更高效地完成任务。
Link (CXL)是一种开放式行业标准的互连方式。它能够在主机处理器与加速器、内存缓冲区以及智能 I/O 设备等设备之间搭建连接。这种连接具备高带宽和低延迟的特点。它可以满足高性能异构计算的需求。同时,它还能维护 CPU 内存空间和连接设备内存之间的一致性。CXL 的优势主要体现在极高的兼容性以及内存一致性这两个方面。
它是一种高速、低延迟的互连技术,是由 IBTA(Trade)所提出的。该技术规定了一整套从链路层到传输层的完整规范,这里的传输层并非传统 OSI 七层模型的传输层,而是在其之上的那一层。然而,它无法与现有的以太网相兼容。它具备高吞吐量和低延迟的特点,扩展性良好,通过交换机在节点间建立点对点通道来进行数据传输,这些通道是私有且受到保护的。
以太网是应用广泛且成熟的网络技术,能够在数据中心的服务器之间传输大量数据,这对许多加速计算任务有着重要意义。在 RoCE 协议之下,以太网将 RDMA 功能融合在一起,从而在高性能计算场景下,其通信性能得到了大幅提升。今年,网络巨头联合成立了超以太网联盟(UEC),以应对 AI 和 HPC 工作负载带来的新挑战。超以太网解决方案堆栈能够利用以太网的普遍性与灵活性,处理各类工作负载,并且具备可扩展性和成本效益,为以太网注入了新的活力。
加速计算起到了在传统 CPU 与日益增长的数据需求之间搭建桥梁的作用。从数据中心到边缘计算,加速计算在各种领域都有广泛应用。英伟达创始人黄仁勋曾表明,计算发生了根本性变化,CPU 扩展的时代已经结束,购买再多的 CPU 也无法解决问题。加速计算将与 AI 一同推动,新计算时代的“引爆点”已经到来。