过去 50 年,芯片变强主要靠"把晶体管做小"(摩尔定律)。这条路撞了两堵墙:
① 越做越贵。据 IBS 创始人 Handel Jones,一颗芯片的平均设计成本从 28nm ≈ $40M 涨到 7nm ≈ $217M。
② 芯片不能无限大。光刻机有"掩模版极限"(reticle limit),单颗芯片最大约 26×33mm ≈ 858mm²。但一颗现代 AI 加速器要的硅面积远超这个数。
行业的解法:别再做一整颗巨大的单片芯片(monolithic die),而是拆成若干小芯片 chiplet(计算、I/O、内存各自独立、分开制造、良率更高更便宜),再在封装里把它们"密集缝回去",让它们表现得几乎像一颗芯片 —— 这就是异构集成(Heterogeneous Integration),干这活儿的学科就是先进封装。它是明确的 "More than Moore":不靠更小的晶体管,照样拿系统级性能。
对中国的意义:EUV 光刻被卡、SMIC 大致停在 7nm、台积电 CoWoS 又不给受限的中国 AI 芯片做封装。所以"在可用节点做小 chiplet,再用 chiplet+硅桥+HBM 拼出高算力系统",几乎是中国做高端 AI 算力最现实的一条路。
把这两堵墙说透:第一堵是经济墙。先进制程的研发与设计成本呈指数上升 —— 不只是流片贵,光是设计验证、IP、掩模(mask set)就足以让多数产品在 5nm/3nm 上"算不过账"。当单位晶体管的成本不再随节点下降(Dennard 微缩与成本微缩双双失速),"为了更小而更小"在商业上就不成立了。
第二堵是物理墙(reticle limit)。一台 EUV/DUV 光刻机单次曝光的视场约 26mm × 33mm,约 858mm²。AI 加速器(如 GPU + 多颗 HBM)想要的硅面积远超这个上限,单片根本印不下。
对被 EUV 卡住的中国而言,第二条路不是"备选",而是当前能拿到高算力的主路。这也是为什么"先进封装"从产业链末端,被抬到了战略高地 —— 它是绕过光刻限制、把现有 7nm 级 chiplet 拼成大算力系统的关键手段。
同样是把芯片并排连起来,三条路在"密度 / 成本 / 尺寸 / 供电"上各有取舍。硅桥取了中间那条最划算的。
代价 —— 热机械应力(CTE 失配)。硅几乎不热胀(CTE ~2.6 ppm/°C),有机基板热胀很多(~15–30+ ppm/°C)。把硬硅桥埋进会膨胀的有机里 → 翘曲 warpage、分层、microbump 疲劳。NVIDIA Blackwell(CoWoS-L)的良率/改版延迟就栽在这上面。盛合招股书专门强调其类 CMP "湿抛"工艺解决"干磨磨裂桥内 TSV"的问题 —— 正是冲着这类应力去的。
布线密度最好,但贵:光硅 interposer 本身就占封装成本的 40–60%,要复杂的 TSV 工艺,尺寸还被光刻限制在 ~2500–2700mm²。更关键的是这块硅大部分是"浪费"的 —— chiplet 其实只在彼此接缝处才需要超密布线,不是整片都要。
便宜、灵活,还能当应力缓冲层;但 ~2µm 的 line/space 比不过硅的密度和信号完整性(signal integrity),最高端产品的供电(power delivery)也吃力。
把小硅桥(通常 2×2mm 到 8×8mm)只埋在"两颗芯片相遇的地方",塞进更便宜的有机基板里。需要带宽的地方拿到硅级密度,其余地方全用便宜的有机布线。
三家巨头都把方案分成"全硅 / 有机 / 硅桥"三档。SmartPoser-BD 对应的是硅桥那一档(高亮行)—— 架构同族,但盛合是"已验证未量产",而 EMIB 已量产近十年、CoWoS-L 正在撑起 NVIDIA Blackwell。
| 技术 | 厂商 | 桥 / interposer 形态 | µbump pitch | 关键备注 |
|---|---|---|---|---|
| EMIB / EMIB-T | Intel | 硅桥直接埋进有机基板,无独立 interposer | 55→45µm 路线图 25µm | 2/2/2µm(L/S/厚),4 层金属;EMIB-T 加 TSV 走供电 + 支持 HBM4;单芯片可达 2 万连接;~0.3 pJ/bit |
| CoWoS-S | 台积电 | 全硅 interposer + TSV | 亚微米 RDL ~1200 IO/mm² | 最大 3.3× reticle(~2700mm²);H100、MI300;成本最高 |
| CoWoS-R | 台积电 | 有机 RDL interposer(InFO) | 4µm pitch 2/2µm L/S | 更便宜、灵活、做 CTE 缓冲;用于 AI ASIC / 网络芯片 |
| CoWoS-L | 台积电 | LSI 硅桥埋进 RDL interposer("重构 interposer") | 桥内亚微米 | >3000mm²,最多 12 颗 HBM3;NVIDIA Blackwell GB200 |
| Cube-S / R / E | 三星 | 硅 interposer / 有机 RDL / 嵌入式硅桥 | I-CubeE 55µm | 2.3D Cube-E 用 FO-PLP + 无 TSV RDL + 硅桥;最多 12 颗 HBM |
| S-Connect / FOEB | Amkor / 日月光 | 高密度扇出里的硅桥,铜柱走供电 | 细间距 | SPIL FOEB:1 ASIC + 4 HBM,3 层 RDL(信号 2/2µm);MI200 用过 |
| XDFOI / eSinC | 长电 / 华天 | RDL 堆叠 interposer(无 TSV)+ 桥变体 | 2µm L/S | 长电 XDFOI 已量产 4nm chiplet 封装、最大 ~1500mm²;华天 BiCS 用 LSI 桥 |
| SmartPoser-BD | 盛合 SJSemi | 嵌入式硅桥进 fan-out RDL;高铜柱 + 桥内 TSV | 官方未公布 | 融合 SmartPoser-Si + RDL 特性;验证完成 · 未量产 对标 EMIB / CoWoS-L |
架构上和 EMIB / CoWoS-L / Cube-E 是同一族。盛合的桥把它的硅 interposer 本事(TSV、高铜柱)和它的精细有机 RDL(最细 2µm/2µm,最多 6 层金属/6 层介质,即 "6P6M")合在一起。但它是"已验证",不是"已量产" —— 而 EMIB 从 ~2017 年就在大批量出货,CoWoS-L 今天正在撑起 Blackwell。盛合真正量产的是硅 interposer 的 SmartPoser-Si;桥是它路线图上的下一步。
AI 加速器需要两样:①巨大的总硅面积(多颗计算 chiplet,超过 reticle 极限);②海量内存带宽(多颗 HBM,每颗 ~1024-bit 总线)。桥正好在 HBM 总线落点处给出硅级互联,其余留在便宜有机上,而且桥能撑比单片 interposer 更大的封装(EMIB 到 12+ reticle;CoWoS-L >3000mm²)。EMIB-T 在桥里加 TSV,正是为 HBM4/4e 供电 —— 这个信号说明:下一代 AI/HBM,行业选的是"桥",不是"全 interposer"。
| 架构档位 | 盛合 SJSemi | 台积电 TSMC | 三星 Samsung | 盛合状态 |
|---|---|---|---|---|
| 全硅 interposer | SmartPoser-Si | CoWoS-S | 2.5D Cube-S | 量产 · 大陆~85% |
| 有机 RDL | SmartPoser-RDL | CoWoS-R | 2.3D Cube-R | 小量试产 |
| 嵌入式硅桥 | SmartPoser-BD | CoWoS-L | 2.3D Cube-E | 验证完成 |
总部在江苏江阴,上海、圣何塞设分支;董事长/CEO 崔东,前中芯国际执行副总裁。研发人员 734(2024 年末),员工总数 5332。
五轮,累计超 $2B。A 轮(2015)有 SMIC、Qualcomm Ventures、国家集成电路产业投资基金("大基金");2024 年末又完成约 $700M 一轮,投资方几乎全是国资(无锡产业发展基金、上海国资、全国社保基金等)。
三大板块:中道晶圆加工(bumping/CP)、晶圆级封装(WLCSP)、chiplet 多芯片集成(2.5D/3D)。据 Gartner,2024 年大陆 12 吋 bumping 产能(~25%)、12 吋 WLCSP 收入(~31%)、2.5D 收入(~85%)均为大陆第一;全球第 10 大 OSAT、大陆第 4,是全球前十里收入 CAGR 最快的。营收 16.33→30.38→47.05 亿(2022-24)→ 65.21 亿(2025);净利润从 −3.29 亿(2022)转正到 +9.23 亿(2025)。
累计授权专利 591 件;产业化专利 229 件(境内发明 157 + 境外 72)。
先进封装能让一个国家在没有最先进光刻的情况下,把性能往上拉。华为昇腾 910C 就是典型:把两颗 910B die 共封 —— die 在 SMIC 7nm 上做,据 SemiAnalysis 用两块硅 interposer + 一块有机基板连起来 —— 教科书级 chiplet 战术。
盛合招股书自己把 chiplet 多芯片封装定位为"中国用国产工艺发展高算力芯片最现实、最重要的制造路线",具"重大战略意义"。但要清醒:盛合在一个成熟细分(硅 interposer 2.5D)对标了领先水平,在硅桥和 3D 前沿仍是"已验证但落后",Intel/TSMC/三星那里有数年领先。
真正的瓶颈是 HBM。据多方报道,当前卡中国 AI 算力的,越来越是 HBM 供给,而不是晶圆产能或封装本身。
它能让一个国家在没有最先进光刻的情况下把性能往上拉。中国被切断 EUV、被切断台积电 CoWoS(不给受限中国 AI 芯片做封装),SMIC 又大致停在 7nm。现实路线就是:在可用节点做小 chiplet,再用 chiplet + 桥 + HBM 拼出高性能系统。华为昇腾 910C 把两颗 910B die 共封,就是教科书级案例。
单一"客户A"——很可能是一家领先的国产 AI 芯片公司——2025 上半年占营收 74.4%、占应收账款 83.65%。公司被业内(虽非官方)广泛视为华为昇腾生态的核心封装供应商。这种集中度是双刃剑:绑定头部客户带来高增长,但客户一旦流失或调整供应链,冲击会非常直接。这是 ~1400–1700 亿估值的核心风险点之一。
今天能量产的是 SmartPoser-Si。门槛:封装 > ~2500mm² 或需 >2 个 reticle 硅面积时,桥/RDL 成为必须(全硅撞光刻极限)。押注前务必拿盛合的桥翘曲/可靠性数据在你自己的 die 尺寸上验证 —— CTE 翘曲是设计相关的。
(a) BD 从"验证"走到有名字的量产客户(关键催化剂);(b) 客户A 那 ~74% 份额能否下降(去风险);(c) hybrid bonding / 3DIC 进展(公开落后、又卡下一代 AI)。验证转不了量产、或丢客户A,~1400–1700 亿估值会被实质削弱。
这是中国绕过"光刻墙"最可信的一条路,不是弯道超车。盛合在一个成熟细分到了对标领先,在桥和 3D 前沿是"已验证但落后"。记住:真正卡脖子的,越来越是 HBM 供给。