DeepSeek百万级上下文突破:AI算力范式转变与芯片估值重估
Unlock More Features
Login to access AI-powered analysis, deep research reports and more advanced features

About us: Ginlix AI is the AI Investment Copilot powered by real data, bridging advanced AI with professional financial databases to provide verifiable, truth-based answers. Please use the chat box below to ask any financial question.
Related Stocks
基于最新的行业数据和深度研究,我来为您系统分析DeepSeek上下文长度突破百万级token的影响。
根据2025年大模型年度测评数据,
- DeepSeek免费AI助手上线短短几周,DAU突破3000万,MAU达3370万,刷新行业纪录[2]
- DeepSeek-V3获得77,700+GitHub星标,展现开源生态影响力[2]
- API输入Token价格仅为**$0.028–$0.28**,远低于OpenAI、Google等竞争对手[2]
DeepSeek的技术突破正在从根本上改变AI竞争格局。根据Lex Fridman与AI领域专家的深度对话分析:
“如果你发布一个开放模型,首要目的就是希望人们去使用它。紧随其后的是透明度和信任等因素。当你观察中国时,最大的原因在于他们希望全球用户都能使用这些模型。”[3]
| 维度 | 传统格局 | DeepSeek引领的新格局 |
|---|---|---|
市场策略 |
闭源、高价、API授权 | 开源、低价、普惠AI |
技术路线 |
堆算力、堆参数 | 算法创新、效率优先 |
生态构建 |
封闭花园 | 开源协作 |
目标市场 |
发达国家 | 全球覆盖(含非洲2-4倍使用率增长)[3] |
DeepSeek的**“开源、强大、低价”**三大特性使其成为唯一同时满足这三项的顶级模型[2]:
- 全球用户覆盖:国内市场89%份额,白俄罗斯56%,古巴49%[3]
- 商业模式创新:母公司量化基金实现53%回报率,利润超7亿美元,零外部融资支撑研发[3]
- V4预期突破:据透露,V4代码生成和处理能力有望超越Claude和GPT系列[3]
根据Kimi的实践分析,长上下文能力直接决定Agent的应用深度[4]:
- DeepSeek的定位:通过Engram架构推动"计算与记忆解耦",突破传统KV Cache限制[4]
- Kimi的路径:采用KimiLinear架构,在百万级上下文下实现6-10倍端到端速度提升[4]
- 技术收敛方向:专业化Agent模型 + 超长上下文处理能力
DeepSeek的Engram架构揭示了一个关键趋势:
- KV Cache占用显存随上下文长度线性增长
- 128K上下文可能消耗数十GB显存
- GPU显存瓶颈导致推理失败率上升[5]
- 1000亿参数的Engram表存储运行在CPU内存中
- 仅产生**小于3%**的可忽略开销[5]
- 通过稀疏查表操作替代昂贵的重复计算
| 需求类型 | 传统模式 | 新范式影响 |
|---|---|---|
GPU算力 |
主导地位 | 持续增长但占比下降 |
CPU需求 |
辅助角色 | 成为新的性能瓶颈 |
内存/存储 |
配角地位 | 战略性需求激增 |
带宽需求 |
均衡发展 | CPU-GPU通信成为新瓶颈 |
- Agent场景下,CPU端工具处理占延迟的43.8%~90.6%[5]
- 高并发时Batch Size=128,CPU能耗接近GPU水平[5]
- KV Cache Offload至SSD成为关键技术路径[5]
DeepSeek R1的发布对NVIDIA既是挑战也是机遇。根据NVIDIA技术博客数据:
通过快速软件优化,DeepSeek-R1 671B模型实现了
32倍成本降低和推理吞吐量大幅提升[6]
- 推理需求激增:Agent规模化应用需要更多推理算力
- 软件优化效率:NVIDIA CUDA生态持续优化DeepSeek等模型推理效率
- HBM需求:长上下文对高带宽内存需求持续旺盛
- 训练需求 → GPU采购量 → 估值增长
- 核心假设:算力增长 = GPU增长
估值 = GPU价值 × α + CPU价值 × β + 存储价值 × γ + 互联带宽价值 × δ
- α(GPU权重):从1.0下降至0.5-0.7
- β(CPU权重):从0.1上升至0.2-0.3
- γ(存储权重):从0.05上升至0.1-0.15
- δ(带宽权重):新增变量,权重0.05-0.1
根据希捷和闪迪的财报数据[5]:
- 希捷:2026年产能已分配完毕,开始接受2027年上半年订单
- 闪迪:Q2营收30.25亿美元,同比增长61%,净利润暴增672%
- 预测:2026年数据中心将首次成为NAND的最大市场[5]
- 高性能CPU成为Agent调度核心
- 多线程处理能力成为关键指标
- CPU-GPU协同优化成为新竞争焦点
| 优先级 | 产业链环节 | 逻辑支撑 | 代表企业 |
|---|---|---|---|
1 |
企业级SSD | KV Cache Offload核心需求 | 三星、闪迪 |
2 |
高端CPU | Agent调度瓶颈 | Intel、AMD |
3 |
HBM内存 | 长上下文必备 | SK海力士 |
4 |
GPU | 推理需求增长 | NVIDIA |
5 |
先进封装 | 异构集成需求 | 台积电 |
- DeepSeek技术路线风险:若V4或其他版本未达预期,可能影响整个技术范式的推进
- 地缘政治风险:芯片供应限制可能改变产业链布局
- 商业化进度风险:开源模式能否持续支撑高研发投入
- 估值泡沫风险:AI板块整体估值已计入过多乐观预期
- 格局重塑确定:DeepSeek引领的"高效+开源+普惠"范式已不可逆转
- 算力需求结构转变确定:从单一GPU依赖转向异构计算
- 产业链价值重估进行中:存储和CPU迎来价值重估窗口
- 维持GPU配置(NVIDIA),但降低估值权重预期
- 增配存储芯片(SSD/HBM)配置
- 适度配置高端CPU龙头
- 关注国产替代机会(华为昇腾、寒武纪等)
[3] Lex Fridman硬核访谈:从DeepSeek、开源、Agent
Insights are generated using AI models and historical data for informational purposes only. They do not constitute investment advice or recommendations. Past performance is not indicative of future results.
About us: Ginlix AI is the AI Investment Copilot powered by real data, bridging advanced AI with professional financial databases to provide verifiable, truth-based answers. Please use the chat box below to ask any financial question.