| 工作负载 | LLM时代 | Agentic AI时代 | 变化 |
|---|---|---|---|
| Token生成 | GPU负责 | GPU负责 | — |
| 任务规划 | CPU辅助 | CPU核心 | ⬆ 最大变化 |
| 工具调用 | 无 | CPU核心 | ⬆ 新增需求 |
| 逻辑判断 | 无 | CPU核心 | ⬆ 新增需求 |
| 状态管理 | 无 | CPU核心 | ⬆ 新增需求 |
| 延迟占比 | GPU延迟主导 | CPU延迟占50-90% | ⬆ 结构性变化 |
📊 市场空间预测:
| 细分赛道 | 2025年 | 2030年E | CAGR | 备注 |
|---|---|---|---|---|
| 服务器CPU | 270亿美元 | 1000+亿美元 | 30%+ | 6个月交货周期 |
| DDR5内存 | 基数小 | 翻倍以上 | — | KV缓存驱动 |
| CXL互联 | 起步期 | 高速增长 | — | 内存扩展标准 |
| AI服务器架构 | GPU密集型 | CPU+GPU均衡型 | — | 整机重新设计 |
x86阵营(主要增量):
🔑 中国独特机遇:
| 环节 | 利润空间 | 代表公司 | 核心壁垒 |
|---|---|---|---|
| 芯片设计 | 60%+毛利 | 英伟达/AMD/海光/寒武纪 | 生态绑定 |
| 服务器ODM | 5-10%毛利 | 工业富联(全球最大AI服务器制造商) | 规模+良率 |
| 光模块 | 20-30%毛利 | 中际旭创(全球份额第一) | 技术壁垒 |
| 工具链/平台 | 高毛利 | 微软/百度/科大讯飞 | 软件边际成本低 |
| 公司 | 代码 | 核心定位 | A股映射 |
|---|---|---|---|
| 英伟达 | NVDA | AI全栈:Blackwell+Vera CPU+NeMoClaw | 寒武纪/海光 |
| 微软 | MSFT | Copilot生态:Windows+Office+Azure | 科大讯飞 |
| 谷歌 | GOOGL | TPU+Gemini,多模态领先 | 百度 |
| AMD | AMD | CPU+GPU双轮驱动 | 海光信息 |
| 英特尔 | INTC | CPU+边缘AI,PC端侧优势 | — |
| 特斯拉 | TSLA | 具身智能:Optimus+FSD | 拓普集团 |
| Palantir | PLTR | 企业级Agent,国防领域深度布局 | — |
| 赛道 | A股/港股标的 | 代码 | 核心逻辑 | 确定性 |
|---|---|---|---|---|
| 算力芯片CPU | 海光信息 | 688041 | x86兼容,国产替代,批量出货 | ★★★★★ |
| AI加速芯片 | 寒武纪 | 688256 | 对标英伟达,商业化路径待验证 | ★★ |
| AI服务器ODM | 工业富联 | 601138 | 全球最大AI服务器制造商,绑定北美云厂 | ★★★★★ |
| 光模块 | 中际旭创 | 300308 | 全球高速光模块份额第一,800G/1.6T升级 | ★★★★★ |
| 具身智能-核心件 | 拓普集团 | 601689 | 特斯拉Optimus核心零部件供应商 | ★★★ |
| 具身智能-电机 | 鸣志电器 | 603728 | 电机驱动 | ★★ |
| 具身智能-热管理 | 三花智控 | 002050 | 热管理系统 | ★★ |
| 大模型+Agent | 科大讯飞 | 002230 | 星火大模型,语音Agent先行者 | ★★★ |
| 大模型+Agent | 百度集团 | 9888.HK | 文心一言+ERNIE Agent,最早布局 | ★★★ |
| 大模型+Agent | 腾讯控股 | 0700.HK | 混元大模型+微信生态,最大用户流量 | ★★★ |
| 分歧点 | 乐观派 | 谨慎派 | 验证方式 |
|---|---|---|---|
| CPU/GPU配比 | 1:1甚至更高,CPU需求暴增 | 部分场景CPU独立运行,实际需求待验证 | 跟踪AWS/Azure/阿里云采购结构变化 |
| 国产CPU能否满足需求 | 海光信息x86兼容已有出货 | 华为鲲鹏生态仍在建设,寒武纪通用CPU弱 | 跟踪大厂测试结果和批量出货时间 |
| DDR5/CXL内存弹性 | 长上下文KV缓存→单机内存翻倍 | HBM正在替代部分DDR5需求 | 跟踪三星/美光/海力士出货数据 |
| 指标 | 数据来源 | 频率 | 意义 |
|---|---|---|---|
| 全球服务器CPU交货周期 | 渠道调研 | 月度 | 供需紧张度领先指标 |
| 工业富联营收增速 | 财报 | 季度 | AI服务器需求温度计 |
| DDR5合约价 | DRAMexchange | 月度 | 内存景气度验证 |
| 中际旭创800G/1.6T出货量 | 财报+调研 | 季度 | 光模块需求核心指标 |
| 科大讯飞星火Agent商业化 | 财报 | 季度 | A股Agent落地进度 |
| 国内大厂资本开支 | 财报 | 季度 | 算力投资强度 |
✅ 强逻辑(已验证,业绩确定性高):
⚡ 主题炒作(高风险高弹性):
🔑 核心框架:Agent = "模型 + Harness(缰绳)"
Harness包括:工具调用 + 持久记忆(RAG+结构化记忆+自我反思)+ 策略边界(guardrails)+ 编排层(orchestration)+ 上下文管理
早期失败共同病因:幻觉 + 工具调用不可靠 + 上下文丢失
2026年突破路径:混合系统(LLM推理 + 确定性代码/工具执行)+ 更好的人机协作,而非追求"完全自治"
📊 CPU超级周期丰满数据:
| 指标 | 数据 |
|---|---|
| Arm预测:AI数据中心每GW CPU核心需求 | 3000万 → 1.2亿核(4倍增长) |
| NVIDIA Vera CPU | Rubin平台,专为Agentic reasoning/RL/orchestration设计 |
| Morgan Stanley:数据中心CPU TAM到2030年 | 数百亿至千亿美元 |
| 边缘侧需求 | 低功耗NPU/CPU(机器人/IoT)更迫切 |
| 具身智能 | 放大实时低延迟CPU+传感器融合需求(Optimus) |
🤖 多模态Agent核爆点:NVIDIA Nemotron 3 Nano Omni(2026年4月)
🔗 产业链补充(报告未覆盖的重要公司):
| 层级 | 公司 | 角色 |
|---|---|---|
| 中游-编排层 | UiPath | RPA龙头转型企业级Agent orchestration平台 |
| 中游-协议 | Anthropic | MCP协议核心贡献者,推动工具调用标准化 |
| 上游-内存 | 美光科技(MU) | DDR5内存核心供应商 |
| 上游-互联 | 三星 | CXL互联标准主要推动者 |
| 具身智能 | 宇树科技(未上市) | 四足/人形机器人,机器狗出货量全球领先 |
| 具身智能 | 三花智控(002050) | 机器人关节热管理 |
🎯 分阶段投资逻辑:
| 时间轴 | 重点 | 标的 |
|---|---|---|
| 短期(1-12月) | CPU/服务器供应链紧缺;Vera/Rubin落地;多模态Agent效率验证 | 海光、服务器ODM、光模块 |
| 中期(1-3年) | 中游orchestration平台与企业集成;垂直行业落地(中国优势) | 讯飞、百度、企业软件龙头 |
| 长期(3年+) | 具身智能闭环,物理世界生产力革命 | 拓普、三花、具身智能产业链 |