2026 年 5 月底,DeepSeek 把 V4-Pro 的 API 价格永久打到原价的四分之一。对正在评估大模型落地的企业来说,第一反应往往是:既然调用这么便宜,私有化部署是不是没必要了?这篇文章帮 CIO 和数字化负责人厘清一个决策点——降价之后,「自建 vs 调云」的账到底该怎么重算,什么情况下私有化仍然是更划算的选择。
一、降价之后,"自建还是调云"又被摆上了桌
DeepSeek 这次降价的幅度不小。2026 年 4 月 26 日,它先把全系 API 的输入(缓存命中)价格降到首发价的十分之一,V4-Pro 又叠加了一个限时 2.5 折;5 月 22 日晚,官方宣布 2.5 折不再限时,转为永久价格。降价后,V4-Pro 每百万 tokens 的价格是:输入(缓存命中)0.025 元、输入(缓存未命中)3 元、输出 6 元——这一档促销在 5 月 31 日结束后,将正式固定为原定价的四分之一 [1][2]。
值得注意的是,这是一次"逆势"降价。同一时期,国内多数厂商在涨价:字节豆包推付费订阅,智谱三次上调 API 价格,阿里云和腾讯云相继宣布涨价 5% [2]。DeepSeek 反向把价格永久打下来,同时还在推进 700 亿元融资、明确坚持开源 [3]。
对企业来说,这意味着一件事:调用公有云大模型的边际成本,正在快速逼近"几乎可以忽略"。于是那个老问题又被摆上桌——我们还要不要花钱自建?
二、算账之前,先看清三个约束和三个误区
把这笔账算清楚之前,要先看清三个常被忽略的约束,和三个常踩的误区。
三个真实约束
- 数据能不能出内网:金融、医疗、政务、央国企的很多数据,合规上根本不允许发到外部 API。这一条往往直接决定方案,跟单价没关系。
- 信创与自主可控要求:越来越多政企采购要求适配国产 CPU、国产操作系统、国产算力,调用境外或公有云服务无法满足。
- 长期调用规模:API 单价低,不等于总成本低。调用量到一定量级,按量付费会持续累加,而私有化是一次性投入摊薄。
三个常见误区
- "API 便宜了就全调云":只算了单价,没算数据合规这条硬约束,也没算调用量上来之后的长期账。
- "私有化只看一次性硬件投入":忽略了部署、调优、运维的持续成本,也容易反过来高估自建门槛。
- "接个 API 就算 AI 落地了":真正能用的系统还要接入权限、业务流程、知识库、监控和运维,单价只是其中很小一块。
三、自建 vs 调云,到底在比什么
"自建 vs 调云"不是单价高低的比较,而是多个维度的权衡。下面这张表把决策点摊开:
| 维度 | 调用公有云 API | 私有化部署 |
|---|---|---|
| 数据安全 | 数据需出内网,受限于服务商合规 | 数据完全不出内网,满足金融/医疗/政务要求 |
| 信创国产化 | 难以满足国产 CPU/OS/算力要求 | 可适配昇腾 NPU、寒武纪、平头哥、国产 GPU |
| 成本结构 | 按量付费,单价低、随调用量持续累加 | 一次性投入 + 运维,中大规模摊薄后更优 |
| 延迟可控性 | 受公网与服务商波动影响 | 内网部署,延迟与稳定性自主可控 |
| 定制与微调 | 受 API 能力边界限制 | 可基于私有数据做 SFT/微调,更懂业务 |
| 运维负担 | 几乎为零 | 需要团队或服务商支撑 |
私有化部署的硬件门槛,可以用 DeepSeek 的一个参考配置感受量级(以下为参考配置,实际需按并发量与推理速度要求评估):
| 模型规模 | 内存 | 显卡 | 适用场景 |
|---|---|---|---|
| DeepSeek-R1 1.5B | ≥4GB | 4GB 显存 | 个人 / 小型测试 |
| DeepSeek-R1 7B | ≥16GB | 8GB 显存 | 小团队 / 部门级 |
| DeepSeek-R1 32B | ≥64GB | 2×24GB 显存 | 中型企业 |
| DeepSeek-R1 70B | ≥128GB | 4×80GB 显存 | 大型企业 / 行业 |
可以看到,部门级试点的硬件门槛并不高;真正的成本变量在并发规模和运维,而不是"买不买得起一张卡"。
四、与其纠结,不如按四步走一遍
与其纠结"该不该自建",不如按下面四步把决策走一遍:
- 先定约束,而不是先比单价:数据能不能出内网、有没有信创要求——这两条是"一票否决"项。命中任意一条,私有化基本是前提,单价不参与决策。
- 再算两笔账,找临界点:把预计的月调用量代入。调用量小、数据不敏感,调云更划算;调用量持续走高,按量付费累计会越过私有化的一次性投入,这个交叉点就是你的决策临界点。
- 先做小场景 PoC:不要一上来就大规模自建。挑一个高频、标准化、可评估的场景(如客服问答、文档检索),用最小代价验证效果和真实调用量。
- 按指标评估再规模化:用 PoC 跑出来的准确率、响应延迟、单位成本去校准账本,再决定扩大私有化还是继续调云。
降价改变的,其实只是第 2 步里那个临界点的位置——它把"调云划算"的区间推大了,但没有动第 1 步那两条硬约束。
五、什么情况选哪个
- 优先调云:数据不敏感、无信创要求、调用量不大或波动大、希望快速验证的场景。降价后这类场景的性价比进一步提升。
- 优先私有化:数据不能出内网(金融、医疗、政务、央国企)、有信创国产化要求、中大规模长期调用、需要基于私有数据深度微调的场景。
- 混合更现实:很多企业的最优解是"敏感业务私有化 + 通用场景调云",按数据密级和调用量分层。
对多数企业来说,难点其实不在选哪个模型,而在于把约束、调用量、合规和运维这几件事一起算清楚——这正是 10 年工程落地经验能补上的部分。
如果你正在评估大模型私有化部署,但不确定该自建还是调云,海星技术服务可以用 30 分钟帮你梳理一条按约束和成本算得清的路径。电话 / 微信:13857135304(舒先生)|官网:https://www.seastart.cn
资讯来源
- [1] IT之家 - DeepSeek-V4-Pro API 宣布永久降价,调整为原定价的 1/4: https://www.ithome.com/0/954/188.htm
- [2] 新浪财经 - DeepSeek-V4-Pro API 永久降价至原价四分之一: https://finance.sina.com.cn/wm/2026-05-25/doc-inhzchzh3475871.shtml
- [3] 证券时报 - DeepSeek 官宣永久降价!正在推进 700 亿元融资: https://www.stcn.com/article/detail/3924059.html
数据说明:DeepSeek 私有化硬件配置为参考配置,实际需按并发量与推理速度要求评估,支持昇腾 NPU、国产 GPU 方案。客户数据如涉及落地案例,发布前须脱敏。