您的位置:首页 >动态 > 综合精选 >

AMDInstinctMI300AAPU进入量产HPC速度比NVIDIAH100快4倍效率提高一倍

导读 除了面向AI的MI300X之外,AMD还宣布其InstinctMI300AAPU已进入量产,预计明年推出时将提供全球最快的HPC性能。我们多年来一直等待AMD最终兑...

除了面向AI的MI300X之外,AMD还宣布其InstinctMI300AAPU已进入量产,预计明年推出时将提供全球最快的HPC性能。

我们多年来一直等待AMD最终兑现Exascale级APU的承诺,随着InstinctMI300A的推出,这一天也越来越近了。今天,AMD确认MI300AAPU本季度已进入量产,并有望在2024年上市时成为全球最快的HPC解决方案。

AMDInstinctMI300AAPU结合了多种架构和互连技术,其中最前沿的是Zen4、CDNA3和第四代Infinity架构。MI300AAPU的一些亮点包括:

高达61TFLOPSFP计算

高达122TFLOPSFP32计算

高达128GBHBM3内存

高达5.3TB/s的内存带宽

1460亿个晶体管

MI300A的包装与MI300X非常相似,只是它使用了TCO优化的内存容量和Zen4核心。因此,让我们详细了解下一代HPC和AI数据中心的百亿亿次马力。

AMDInstinctMI300A加速器。

其中一个有源芯片具有两个CDNA3GCD,被切掉并替换为三个Zen4CCD,这些CCD提供独立的缓存和核心IP池。每个CCD有8个核心和16个线程,因此活动芯片上总共有24个核心和48个线程。还有24MB的二级缓存(每个核心1MB)和一个单独的缓存池(每个CCD32MB)。应该记住,CDNA3GCD还具有独立的L2缓存。

AMDInstinctMI300X和MI300AAI加速器详细介绍:CDNA3和Zen4采用先进封装Marvel5

AMDInstinctMI300A加速器,带CDNA3和Zen4芯片。

在GPU方面,AMD基于CDNA3架构总共启用了228个计算单元,相当于14,592个核心。也就是说,每个GPU小芯片有38个计算单元。总结AMDInstinctMI300加速器的一些突出功能,我们有:

首款集成CPU+GPU封装

瞄准百亿亿级超级计算机市场

AMDMI300A(集成CPU+GPU)

1460亿个晶体管

多达24个Zen4核心

CDNA3GPU架构

228个计算单元(14,592个内核)

高达128GBHBM3内存

多达8个Chiplet+8个内存堆栈(5nm+6nm工艺)

amd-本能-mi300a-apu-for-hpc_4

amd-本能-mi300a-apu-for-hpc_5

1/2

谈到性能数据,AMD再次将MI300A与H100进行比较,但这次是针对HPC特定的工作负载。在OpenFOAM中,InstinctMI300AAPU可提供高达4倍的性能提升,这主要来自于统一的内存布局、GPU性能以及整体内存容量和带宽。与NVIDIA的GraceHopperSuperchips相比,该系统的每瓦性能提高了2倍。

AMD还确认InstinctMI300AAPU现已发货,还将用于为下一代El-Capitan超级计算机提供动力,该超级计算机预计可提供高达2Exaflops的计算能力。值得一提的是,AMD是唯一一家通过Frontier超级计算机突破1Exaflop障碍的公司,也是地球上最高效的系统。

免责声明:本文由用户上传,如有侵权请联系删除!