作者:周源/华尔街见闻
7月28日,锐龙AI 300笔记本上市。
这款机型之所以受到关注是因为搭载了AMD全新的AI处理器“锐龙AI 300系列”(4nm工艺制程)。
这个系列的处理器,采用了AMD全新的Zen 5架构。AMD曾在今年6月初的中国台北国际电脑展上发布了锐龙AI 300系列和锐龙9000系列两款桌面AI处理器,并对Zen 5架构做了简要介绍。
在7月28日搭载了锐龙AI 300系列桌面处理器的笔电上市之前,AMD在美国举办的Zen 5 Tech Day技术活动上,披露了这款处理器的详细技术信息。
Zen 5架构的定制款被称为Zen 5c,特征是更“紧凑”的内核,比标准全功能的Zen 5架构内核小约25%。这两种内核类型,在同一芯片上,具有不同数量的缓存。这是AMD首次做出这样的设计。
AMD在2017年推出Zen架构,取代了之前的Bulldozer(推土机)架构:Zen架构的IPC(平均每周期指令)性能比Bulldozer架构提升了52%,远超预期的40%性能提升值。
在Zen架构推出七年以来,AMD将之迭代了5次。AMD宣称,新推出的Zen 5架构,比前代Zen 4架构的IPC性能提升了16%,“实现了性能的实质性飞跃”。
AMD做了什么努力?
简单来说,AMD做了多项架构改进,包括增加每时钟周期指令数、拓展指令分派与执行带宽、翻倍缓存数据带宽和AI加速等等。比如,通过扩展管道和矢量大小,AMD以此增强Zen 5架构的吞吐能力,这有助于同时处理更多数据并提高核心的并行处理能力。
CPU诞生至今,在设计层面已形成一套成熟的体系。大致上,CPU设计分为前端和后端两个环节,物理模块结构大致包括指令预取与解码、整数执行、浮点执行、载入存储和缓存等不同的单元。
Zen 5架构提升了前端的部分模块的规格,比如从1提升到1.5:AMD设计了双预取、双解码流水线和提升一倍的指令带宽等(前端)。
其中,前端带宽指令翻番,有助于提高处理器处理复杂计算和数据密集型任务的效率。这个新设计,也体现在L1和L2缓存之间,以及增加了L1缓存到浮点(FP)单元的数据传输速率。
Zen 5架构的浮点与矢量执行单元部分,在Zen 4架构引入AVX-512指令集的基础上,从仅支持256位数据宽度,强化为支持完整的512位;L1缓存容量也从32KB增大到48KB,同时从8路增强为12路。
面对如今汹涌澎湃的AI算力和应用需求,Zen 5架构大幅提升了数学加速单元的性能:单核执行数学学习提速最高至32%,AES-XTS指令提速最多至35%。
正因为有了这些技术努力,故而Zen 5架构的IPC性能可提升16%,在有些场景中,甚至能提升35%。
AMD称Zen 5架构整体性能比前代提升幅度“巨大”,是否夸张?
华尔街见闻查阅了Zen架构之前四次迭代的性能提升幅度后发现,这个措辞多少有些夸张。Zen+、Zen 2、Zen 3和Zen 4各自比前代的性能提升幅度分别是3%、15%、19%和13%。这次是16%,不如Zen 3的性能升幅。
但这并没有影响Zen 5架构的技术创新和由此带来的AI性能表现。这是一款符合AI需求的桌面处理器,而采用Zen 3架构的处理器并未具备这些新的技术优势。
7月28日上市的搭载锐龙AI 300系列处理器的笔记本电脑,有Zen 5和Zen 5c两种规格。
这两款处理器采用了完全相同的CPU架构,不同之处是什么?Zen 5c属于定制款,相对来说,因为采用“紧凑型”设计,因此相对Zen 5架构,Zen 5c架构的缓存更小,频率也更低,但能效更高,更符合移动场景需求。
作为一款AI PC处理器,锐龙AI 300系列也采用异构设计,即CPU+GPU+NPU。其中,CPU架构升级到了Zen 5,GPU则采用了RDNA 3.5架构,NPU用了XDNA 2架构。其中,RDNA 3.5架构主要提升了能效比、内存性能和电池续航。
NPU部分,XDNA 2架构将AI引擎单元从20个增加到32个(分四行八列)),每个单元内的MAC数量翻倍;叠加板载内存容量增加的1.6倍、支持Block FP16块状浮点格式、非线性增强支持和8条并发空间流(比前代架构实现翻倍),故而锐龙AI 300系列的NPU算力,高达50 TOPS。
这个指标,在全球范围内,超越了头部同类竞品:Intel Lunar Lake(48 TOPS)、高通骁龙X Elite(45 TOPS)、苹果M4(38 TOPS)。