目前行业内主流的做法不是把内存蚀刻到CPU硅片上(那成本太高、容量太小),而是通过先进封装技术,把内存芯片和计算芯片紧挨着封装在一起,物理距离缩短到了极致。
1. 为什么要这么做?
原因很简单,传统的内存(DDR)离CPU太远了。这个物理距离带来了两大“硬伤”,在AI时代越来越成为瓶颈:
“内存墙”瓶颈:CPU算力增长远超内存带宽,导致CPU常常“饿着肚子等数据”。
能耗巨大:数据在主板走线上传输的能量损耗,甚至比计算本身还高。
2. 巨头们已经行动了
苹果的“样板间”:M系列芯片是成功的商业化案例,通过将内存与芯片封装在一起,实现了高带宽和长续航。
英特尔的“反复”:
尝鲜 (Lunar Lake):2024年推出,证明了能效提升显著。
放弃 (成本太高):CEO随即宣布这设计太贵,且让OEM厂商失去了卖高价内存条的利润,导致生态抵制,成为“绝唱”。
重启 (Razor Lake AX):据最新消息,为了应对AI算力需求,英特尔计划在2028年推出的Razor Lake AX上重拾集成内存设计,主攻高端移动工作站,预计将搭载更快的LPDDR6内存。
3. “真嵌入”为什么暂时做不到?
“把内存颗粒蚀刻进CPU晶圆”,目前主要受限于两个物理现实:
存储技术的尴尬:CPU缓存(SRAM)速度快但密度极低(1MB已是奢侈),主流内存(DRAM)密度高但需要不断刷新,这两种工艺难以在同一个晶圆上完美融合。
成本的天文数字:如果用最先进的制程去造内存,成本将高到无法接受。所以目前的折中方案是“封装在一起”,而不是“蚀刻在一起”。
4. 行业给出的三种“封装级”方案
目前市场上通过先进封装将内存靠近CPU的方案,主要有这三种:
| 技术方案 |
代表产品 |
核心特点 |
使用场景 |
| MoP (封装级内存) |
苹果M系列、英特尔Lunar
Lake / 未来Razor Lake |
高带宽、低功耗 |
AI任务更快 |
| |
|
手机和轻薄本主流方案,出厂即焊死,无法加装。 |
大模型推理、视频剪辑渲染时,响应更流畅。 |
| HBM (高带宽内存) |
英伟达H100、AMD
MI300、英特尔至强Max系列 |
极致带宽、昂贵 |
专业计算 |
| |
|
像积木一样垂直堆叠,紧贴CPU/GPU,是AI训练的首选。 |
普通人用不到,主要用于云端AI训练或超算。 |
| 3D V-Cache
(堆叠缓存) |
AMD 锐龙
X3D系列 |
游戏神器 |
游戏帧率暴涨 |
| |
|
在CPU上再堆一层超大缓存(L3),减少对内存的依赖。 |
尤其适合《CS2》《DOTA》这类吃缓存的竞技游戏。 |
总结
现在的趋势是:普通电脑继续用可插拔的内存条(便宜、灵活);高端笔记本/AI PC越来越多地采用“封装内存”,为了续航和性能牺牲扩展性;服务器/AI计算则全面转向昂贵的HBM。
所以把内存封装去,正是行业巨头们花百亿美金在攻克的方向。只不过在AI彻底改变电脑形态之前,那个能让你自由插拔的内存插槽,暂时还不会消失。