6月3日,AMD董事长兼CEO苏姿丰在Computex 2024展会的开幕主题演讲中,公布了全新云端AI加速芯片路线图,今年将会推出全新Instinct MI325X。同时,AMD还发布了代号为“Strix Point”的第三代AI PC芯片“锐龙AI 300系列”,以及AMD Ryzen 9000系列桌面处理器(Granite Ridge)。
今年将推出MI325X,性能相比英伟达H200提升1.3倍
根据AMD公布的全新云端AI加速芯片路线图显示,AMD今年将会推出全新的AI加速芯片Instinct MI325X,2025年推出MI350,2026年推出MI400。
据介绍,MI325X将延续CDNA3构架,采用第四代高带宽内存(HBM) HBM3E,容量大幅提升至288GB,内存带宽也将提升至6TB/s,整体的性能将进一步提升,其他方面的规格则基本保持与MI300X一致,便于客户的产品升级过渡。
苏姿丰指出,MI325X的AI性能提升幅度为AMD史上最大,相较竞品英伟达H200将有1.3倍以上的提升,同时更有性价比优势,MI325X将于今年第四季度开始供货。
另外,AMD还将在2025年推出新一代的MI350系列,该系列芯片将采用3nm制程,基于全新的构架,集成288GB HBM3E内存,并支持FP4/FP6数据格式,推理运算速度较现有MI300系列芯片快35倍。
据供应链信息透露,MI350将进入液冷世代,为AI服务器运算提供更强的算力、更佳的能源效率。
2026年,AMD还将会推出新一代的MI400系列,保持一年一更新的节奏。
AMD锐龙AI 300系列发布:AI算力高达50TOPS!
早在2023年初,AMD就发布了锐龙7040系列(代号Pheonix)的全球首款集成独立NPU AI引擎的x86处理器,基于全新设计的XDNA架构,算力约10TOPS(每秒10万亿次浮点运算),加上CPU、GPU整体算力约33TOPS,开创了AI PC的新时代。
2023年底,AMD又推出了锐龙8040系列(代号Hawk Point),NPU AI算力一举提升了60%,达到约16TOPS,整体算力也提升至39TOPS。
而最新的代号为Strix Point的“锐龙AI 300系列”,则采用了全新的Zen5 PU架构,GPU内核也升级为了RDNA3.5架构,NPU也是全新的XDNA2架构,号称是“面向下代AI PC/Copilot+ PC的世界一流处理器”。
锐龙AI 300系列首发只有两款型号,“锐龙AI 9 HX 370”和“锐龙AI 9 HX 365”都定位高端市场。
其中,“锐龙AI 9 HX 370”是顶级旗舰,CPU部分拥有12核心24线程,多年来首次在这一定位上提供更多核心,相比锐龙8040系列增加了多达1/3。二级缓存还是每核心1MB,总容量自然增加到12MB。三级缓存终于打破了16MB的“禁锢”,增加了足足一半来到24MB。最高主频5.1GHz。GPU部分不但升级架构,CU单元数量也从12个增至16个,命名为“Radeon 890M”。NPU算力则提升到了50TOPS,增加了2倍有余。
“锐龙AI 9 365”也是高端型号,10核心20线程,二级缓存10MB,三级缓存仍为24MB,最高频率达5.0GHz,NPU算力也是50TOPS,GPU部分也是Radeon 890M。
从AMD第一和第二代XDNA NPU架构的对比图中,可以看到整体布局基本一致,但规模大大扩充。
AI Tile(初代叫AIE Tile)也就是核心的AI计算引擎模块,从之前的20个增加到32个,再加上本身的增强。
Mem Tile也就是本地内存模块,从原来的5个增加到8个,可以更好地配合更大规模的本地调度、运算。
另外,用于互连的交叉总线也从普通的Data Fabric,升级为Zen/RDNA家族上无处不在的Infinity Fabric,传输带宽和效率更高。
AMD声称,XDNA2 NPU的计算能力提升了多达5倍,多任务并行能力翻了一番,能效也提升了最多2倍。
需要指出的是,这里说的AI算力提升5倍,是指的Llama 2 70亿参数大模型的响应速度,从启动到获得第一个token,锐龙AI 9 HX 370达到了锐龙9 8940HS的多达5倍。
另外非常关键的一点,XDNA2首发引入了全新的Block FP16浮点精度,也就是BFloat16、BF16。它在CPU、GPU上已经很常见,而在NPU上还是第一次。
传统的FP8浮点格式性能高而精度不足,FP16浮点格式精度高而性能略逊,而将二者融合起来的BF16可以在精度、性能上达到较好的平衡,灵活性也更高。
同时,大多数AI应用都采用了16位精度,因此有了BF16,不再需要量化为8位精度,减少了转换步骤,提高了执行效率。
高通骁龙X Elite NPU的算力为45TOPS,Intel即将推出的下一代酷睿Ultra Lunar Lake NPU算力同样是45TOPS,锐龙AI 300系列则一举超越二者,成为当今最强NPU。
至于苹果M4,其NPU的算力只有区区38TOPS,还不到Windows阵营这边Copilot+ PC的最低算力需求门槛40TOPS。
随着算力的大幅提升,NPU的应用也将不再局限于一些持续性低负载场景(比如视频会议),而是有了更多可能,一方面可以在更多场景中部分取代CPU、GPU,以更高的能效执行AI运算,大大提升笔记本的续航能力。
另一方面,更强力的NPU配合更强力的CPU、GPU,可以在更多场景中部署端侧AI,进一步摆脱对云侧的依赖,最大好处就是可以避免隐私泄露和安全威胁。
当然,硬件算力再强,也需要生态应用的落地配合。作为AI PC的先行者,AMD 2024年内的ISV合作厂商将超过150家,既有Adobe、微软、Topaz Labs这样的世界级大厂,也有百川智能、钉钉、、无问芯穹、有道这样的国内名企,前途不可限量。
新一代AI PC的最大亮点就是配合最新的Windows系统,可以打造全新的Copilot+体验,比如历史回忆、视频会议实时录制与翻译、协同创作等。
官方提供的数据显示,锐龙AI 9 HX 370对比高通骁龙X Elite,日常办公、生产力创作、多任务、图形等各方面都遥遥领先,尤其是图形计算性能高出了73%。
对比英特尔目前最强的酷睿Ultra 9 185H,无论是日常应用还是游戏,都有着大幅的提升,平均性能提升36%。就看英特尔下一代Lunar Lake的表现了。
对比苹果M3,锐龙AI 9 HX 370在各方面也都有着很大的性能优势,特别是在3D性能上,超出了98%。
锐龙AI 300系列的笔记本将从7月份起陆续上市,目前已有100多款设计,涵盖宏碁、华硕、戴尔、惠普、联想、微星等各大主要OEM品牌。
华硕会在台北电脑展上宣布一系列配备锐龙AI 300系列处理器的笔记本,其中轻薄本有16英寸的灵耀(Zenbook S)、14/15/16英寸的无畏(Vivobook S),创作本有16和13英寸的ProArt P16/X13,游戏本有16英寸的ROG幻系列、14/16英寸的天选系列(TUF GAMING A14/A16)。
微星首批三款,都是16寸大屏机型,包括面向高端商务办公的Summit A16 AI+,轻薄全能游戏型的绝影A16 AI+、主打超薄商务与创作的尊爵A16 AI+。
AMD Zen5 Ryzen 9000系列发布:性能比i9-14900K快56%
全新发布的AMD Ryzen 9000系列桌面处理器(Granite Ridge),基于Zen5构架,第一批产品将于2024年7月推出。
苏姿丰强调,Ryzen 9000系列是继Ryzen 7000“Raphael”和Ryzen 8000“Hawk Point”系列之后,AM5插槽的第三个系列,将配备两个Zen5小芯片,每个小芯片最多有8个核心,最高16个内核和32线程,与Ryzen 7000系列类似。AMD还继续支持SMT(同时多线程功能)。
AMD首批推出了四款CPU产品,都配有2CU RDNA2集显:
Ryzen 9 9950X配备16核心32线程,170W TDP,最高主频5.7 GHz;
Ryzen 9 9900X配备12核心24线程,120W TDP,最高主频5.6 GHz;
Ryzen 7 9700X配备8核心16线程,65W TDP,最高主频5.5 GHz;
Ryzen 5 9600X配备6核心12线程,65W TDP,最高主频5.4 GHz。
根据AMD官方测试,其Zen 5内核面向PC平台的IPC性能相比Zen 4平均提升了约16%。
与英特尔Core i9-14900K相比,AMD旗舰16核心Ryzen 9 9950X在游戏性能测试中的速度快4%到23%。在生产力性能测试中,9950X显示出更大的优势,比英特尔Core i9-14900K快7%至56%。
AMD宣布Ryzen 9000系列将于7月31日推出,具体定价细节将很快将会公布。
本文来源:芯智讯,原文标题:《AMD公布AI路线图:MI325X将比H200快1.3倍!还有全新AI PC芯片!》