AMDInstinctMI300AAPU进入量产HPC速度比NVIDIAH100快4倍效率提高一倍

导读除了面向AI的MI300X之外，AMD还宣布其InstinctMI300AAPU已进入量产，预计明年推出时将提供全球最快的HPC性能。我们多年来一直等待AMD最终兑...

除了面向AI的MI300X之外，AMD还宣布其InstinctMI300AAPU已进入量产，预计明年推出时将提供全球最快的HPC性能。

我们多年来一直等待AMD最终兑现Exascale级APU的承诺，随着InstinctMI300A的推出，这一天也越来越近了。今天，AMD确认MI300AAPU本季度已进入量产，并有望在2024年上市时成为全球最快的HPC解决方案。

AMDInstinctMI300AAPU结合了多种架构和互连技术，其中最前沿的是Zen4、CDNA3和第四代Infinity架构。MI300AAPU的一些亮点包括：

高达61TFLOPSFP计算

高达122TFLOPSFP32计算

高达128GBHBM3内存

高达5.3TB/s的内存带宽

1460亿个晶体管

MI300A的包装与MI300X非常相似，只是它使用了TCO优化的内存容量和Zen4核心。因此，让我们详细了解下一代HPC和AI数据中心的百亿亿次马力。

AMDInstinctMI300A加速器。

其中一个有源芯片具有两个CDNA3GCD，被切掉并替换为三个Zen4CCD，这些CCD提供独立的缓存和核心IP池。每个CCD有8个核心和16个线程，因此活动芯片上总共有24个核心和48个线程。还有24MB的二级缓存(每个核心1MB)和一个单独的缓存池(每个CCD32MB)。应该记住，CDNA3GCD还具有独立的L2缓存。

AMDInstinctMI300X和MI300AAI加速器详细介绍：CDNA3和Zen4采用先进封装Marvel5

AMDInstinctMI300A加速器，带CDNA3和Zen4芯片。

在GPU方面，AMD基于CDNA3架构总共启用了228个计算单元，相当于14,592个核心。也就是说，每个GPU小芯片有38个计算单元。总结AMDInstinctMI300加速器的一些突出功能，我们有：

首款集成CPU+GPU封装

瞄准百亿亿级超级计算机市场

AMDMI300A(集成CPU+GPU)

1460亿个晶体管

多达24个Zen4核心

CDNA3GPU架构

228个计算单元(14,592个内核)

高达128GBHBM3内存

多达8个Chiplet+8个内存堆栈(5nm+6nm工艺)

amd-本能-mi300a-apu-for-hpc_4

amd-本能-mi300a-apu-for-hpc_5

1/2

谈到性能数据，AMD再次将MI300A与H100进行比较，但这次是针对HPC特定的工作负载。在OpenFOAM中，InstinctMI300AAPU可提供高达4倍的性能提升，这主要来自于统一的内存布局、GPU性能以及整体内存容量和带宽。与NVIDIA的GraceHopperSuperchips相比，该系统的每瓦性能提高了2倍。

AMD还确认InstinctMI300AAPU现已发货，还将用于为下一代El-Capitan超级计算机提供动力，该超级计算机预计可提供高达2Exaflops的计算能力。值得一提的是，AMD是唯一一家通过Frontier超级计算机突破1Exaflop障碍的公司，也是地球上最高效的系统。