除了面向AI的MI300X之外,AMD还宣布其InstinctMI300AAPU已进入量产,预计明年推出时将提供全球最快的HPC性能。
我们多年来一直等待AMD最终兑现Exascale级APU的承诺,随着InstinctMI300A的推出,这一天也越来越近了。今天,AMD确认MI300AAPU本季度已进入量产,并有望在2024年上市时成为全球最快的HPC解决方案。
AMDInstinctMI300AAPU结合了多种架构和互连技术,其中最前沿的是Zen4、CDNA3和第四代Infinity架构。MI300AAPU的一些亮点包括:
高达61TFLOPSFP计算
高达122TFLOPSFP32计算
高达128GBHBM3内存
高达5.3TB/s的内存带宽
1460亿个晶体管
MI300A的包装与MI300X非常相似,只是它使用了TCO优化的内存容量和Zen4核心。因此,让我们详细了解下一代HPC和AI数据中心的百亿亿次马力。
AMDInstinctMI300A加速器。
其中一个有源芯片具有两个CDNA3GCD,被切掉并替换为三个Zen4CCD,这些CCD提供独立的缓存和核心IP池。每个CCD有8个核心和16个线程,因此活动芯片上总共有24个核心和48个线程。还有24MB的二级缓存(每个核心1MB)和一个单独的缓存池(每个CCD32MB)。应该记住,CDNA3GCD还具有独立的L2缓存。
AMDInstinctMI300X和MI300AAI加速器详细介绍:CDNA3和Zen4采用先进封装Marvel5
AMDInstinctMI300A加速器,带CDNA3和Zen4芯片。
在GPU方面,AMD基于CDNA3架构总共启用了228个计算单元,相当于14,592个核心。也就是说,每个GPU小芯片有38个计算单元。总结AMDInstinctMI300加速器的一些突出功能,我们有:
首款集成CPU+GPU封装
瞄准百亿亿级超级计算机市场
AMDMI300A(集成CPU+GPU)
1460亿个晶体管
多达24个Zen4核心
CDNA3GPU架构
228个计算单元(14,592个内核)
高达128GBHBM3内存
多达8个Chiplet+8个内存堆栈(5nm+6nm工艺)
amd-本能-mi300a-apu-for-hpc_4
amd-本能-mi300a-apu-for-hpc_5
1/2
谈到性能数据,AMD再次将MI300A与H100进行比较,但这次是针对HPC特定的工作负载。在OpenFOAM中,InstinctMI300AAPU可提供高达4倍的性能提升,这主要来自于统一的内存布局、GPU性能以及整体内存容量和带宽。与NVIDIA的GraceHopperSuperchips相比,该系统的每瓦性能提高了2倍。
AMD还确认InstinctMI300AAPU现已发货,还将用于为下一代El-Capitan超级计算机提供动力,该超级计算机预计可提供高达2Exaflops的计算能力。值得一提的是,AMD是唯一一家通过Frontier超级计算机突破1Exaflop障碍的公司,也是地球上最高效的系统。