返回文章列表
大模型

DeepSeek V4:不只看得懂图,还把价格打到脚踝

DeepSeek V4 做了两件事——补上了"看懂图片"的短板,然后把使用成本砍到原来的一折。两个动作同时出现,说明它不想只当一个技术 Demo,而是想真刀真枪抢企业客户。

2026年4月30日6 min read
DeepSeek V4:不只看得懂图,还把价格打到脚踝

DeepSeek V4 做了两件事——补上了"看懂图片"的短板,然后把使用成本砍到原来的一折。两个动作同时出现,说明它不想只当一个技术 Demo,而是想真刀真枪抢企业客户。


一、识图模式灰度上线:终于不只是"文字搬运工"了

DeepSeek 之前的能力边界很清晰:能读图里的字,但不能理解图本身在说什么。 比如丢一张截图,它能告诉你"这段文字是某某价格",但不会告诉你"这张图是在吐槽商家"。

现在,识图模式开始在网页版和 App 灰度测试了。部分用户的界面里,模式切换已经变成了三个选项:快速模式、专家模式,以及「识图模式」。后端配置字段是这么写的:name: 识图模式description: 图片理解功能内测中。[^1]

民间测试也跟上了。有人让它数图片里的手指,认动漫角色,解读表情包,看猫是开心还是生气。从这些非正式测试来看,V4 的图像理解确实开始往上走了一个台阶——不再只是文字提取,而是触及语义层面的判断。

有意思的是这个时间点:V4 预览版发布才 5 天,识图模式就进灰度了。 这意味着多模态不是临时加的功能,而是早就纳入 V4 整体架构的规划内容。多模态从"有"到"能用",会让 DeepSeek 在文档处理、图文创作、视觉问答这些场景的竞争力上一个台阶。


二、被忽略的护城河:它不是不会崩,而是很少崩

除了识图模式,有人在 V4 的技术细节里挖出一个词——底层工程稳定器。[^3]

这句话的潜台词是:DeepSeek V4 没有把工程优先级排在 benchmark 名次之前。这件事值得多说几句。

大模型落地的坑,大多数不是"答错了",而是"崩了"。训练崩溃意味着 GPU 集群空转几小时;线上幻觉导致合同关键数字被错误引用;推理超时让实时业务流程卡死。这类问题的共同点是:不可预期。你不知道模型什么时候、以什么方式出问题,一旦出问题就是业务级事故。

反过来,稳定性对客户留存的影响是直接可量化的。 企业级 SaaS 的客户流失率每降 5%,利润能提升 25%-95%。对 AI 服务来说这个逻辑更极端——客户切换供应商的交易成本极高,包括数据迁移、Prompt 重写、工作流重构、合规审计重新走一遍。一个"时不时卡一下"的模型,哪怕单次效果稍微领先一点,客户也会因为不确定性成本选择换掉它。

DeepSeek 把工程稳定性放在一个更高的优先级,本质上是在帮客户降低不确定性成本。当大模型竞争从"技术炫技"转向"工程可信",能不能稳定跑业务,比能不能刷榜第一,对企业采购决策的影响更直接。这条护城河不显眼,但一旦建立,客户替换的摩擦成本远高于参数差距带来的收益。


三、永久降价 + 缓存命中打一折:5块钱能干完原来30块的活

定价是 DeepSeek V4 最实在的部分。根据量子位的报道,这套定价策略有三个层次[^2]:

基础价格直接降。 不是限时促销,不是首充优惠,是写入定价表的永久调整。 缓存命中的请求,成本打一折。 基于上下文复用的边际成本优势,重复对话和长对话场景的成本会大幅压缩。 编程场景实测成本降低 83%。 原来首发期要 30 块钱干完的活,现在 5 块钱能干完。

三个维度对不同用户的影响:基础定价降低直接拉低了中小开发者的入场门槛,不用先说服老板批预算,可以从运营成本里直接覆盖;缓存机制的折扣在上下文复用场景下成本优势成倍放大;编程场景的针对性折扣,有助于锁定开发者社区,让 DeepSeek 在工具类场景的渗透率更高。

降价的底气来自两方面:训练和推理成本持续压缩,以及用户规模扩大后的边际摊薄。这不是赔本赚吆喝,而是以规模换利润的 SaaS 逻辑——单次调用利润降低,但总调用量的增长弥补了单位利润的损失。

[MEME: 谨慎]

主流大模型 API 定价对比横向柱状图,DeepSeek V4 对标 GPT-4o / Claude 3.5 Sonnet / 通义千问,单位 token 价格

四、DeepSeek 在做一件事:把大模型「不可能三角」压扁

把上面三件事放在一起看,会发现一个清晰的逻辑:

传统大模型竞争存在一个隐性"不可能三角":能力更强 + 价格更低 + 服务更稳。三者天然互相拉扯——提升能力通常意味着更高算力消耗,压低价格压缩利润空间,扩大规模又可能影响服务质量。

DeepSeek V4 的破法是用架构效率松动三个角

  • 多模态补全 → 图像理解补全后,V4 可进入文档处理、视觉问答等新场景,用户无需切换供应商
  • 工程稳定器 → "不崩"的价值在于帮企业客户省去大量运维和风控投入
  • 缓存机制 + 规模效应 → 缓存命中请求以一折计价,长对话和重复调用场景的成本优势成倍放大
不可能三角框架图,三个顶点分别标注"更强能力""更低价格""更稳服务",中心箭头指向"架构效率提升",形成破局路径

三个动作相互支撑,不是相互挤占。这让 DeepSeek V4 的竞争定位从"某个指标最强的模型"转向"最不容易出意外的模型"。对企业客户来说,这比纸面参数更有说服力。


值得留意的边界:
  • 识图模式的民间测试来自非正式评测,实际能力边界和边界情况尚未经过标准化基准验证
  • 83% 的编程成本降幅是单一场景的实测数据,不同使用模式下结果会有差异
  • "工程稳定器"作为被挖出的技术细节,具体实现机制和量化指标未完全公开,对其战略价值的判断属于分析性推论,不是确认性信息
  • "稳定性降低客户流失率 5% 可提升利润 25%-95%"是行业通用研究结论,非 DeepSeek 特定数据