DeepSeek V4：不只看得懂图，还把价格打到脚踝

DeepSeek V4 做了两件事——补上了"看懂图片"的短板，然后把使用成本砍到原来的一折。两个动作同时出现，说明它不想只当一个技术 Demo，而是想真刀真枪抢企业客户。

一、识图模式灰度上线：终于不只是"文字搬运工"了

DeepSeek 之前的能力边界很清晰：能读图里的字，但不能理解图本身在说什么。 比如丢一张截图，它能告诉你"这段文字是某某价格"，但不会告诉你"这张图是在吐槽商家"。

现在，识图模式开始在网页版和 App 灰度测试了。部分用户的界面里，模式切换已经变成了三个选项：快速模式、专家模式，以及「识图模式」。后端配置字段是这么写的：name: 识图模式、description: 图片理解功能内测中。[^1]

民间测试也跟上了。有人让它数图片里的手指，认动漫角色，解读表情包，看猫是开心还是生气。从这些非正式测试来看，V4 的图像理解确实开始往上走了一个台阶——不再只是文字提取，而是触及语义层面的判断。

有意思的是这个时间点：V4 预览版发布才 5 天，识图模式就进灰度了。 这意味着多模态不是临时加的功能，而是早就纳入 V4 整体架构的规划内容。多模态从"有"到"能用"，会让 DeepSeek 在文档处理、图文创作、视觉问答这些场景的竞争力上一个台阶。

二、被忽略的护城河：它不是不会崩，而是很少崩

除了识图模式，有人在 V4 的技术细节里挖出一个词——底层工程稳定器。[^3]

这句话的潜台词是：DeepSeek V4 没有把工程优先级排在 benchmark 名次之前。这件事值得多说几句。

大模型落地的坑，大多数不是"答错了"，而是"崩了"。训练崩溃意味着 GPU 集群空转几小时；线上幻觉导致合同关键数字被错误引用；推理超时让实时业务流程卡死。这类问题的共同点是：不可预期。你不知道模型什么时候、以什么方式出问题，一旦出问题就是业务级事故。

反过来，稳定性对客户留存的影响是直接可量化的。 企业级 SaaS 的客户流失率每降 5%，利润能提升 25%-95%。对 AI 服务来说这个逻辑更极端——客户切换供应商的交易成本极高，包括数据迁移、Prompt 重写、工作流重构、合规审计重新走一遍。一个"时不时卡一下"的模型，哪怕单次效果稍微领先一点，客户也会因为不确定性成本选择换掉它。

DeepSeek 把工程稳定性放在一个更高的优先级，本质上是在帮客户降低不确定性成本。当大模型竞争从"技术炫技"转向"工程可信"，能不能稳定跑业务，比能不能刷榜第一，对企业采购决策的影响更直接。这条护城河不显眼，但一旦建立，客户替换的摩擦成本远高于参数差距带来的收益。

三、永久降价 + 缓存命中打一折：5块钱能干完原来30块的活

定价是 DeepSeek V4 最实在的部分。根据量子位的报道，这套定价策略有三个层次[^2]：

基础价格直接降。 不是限时促销，不是首充优惠，是写入定价表的永久调整。 缓存命中的请求，成本打一折。 基于上下文复用的边际成本优势，重复对话和长对话场景的成本会大幅压缩。 编程场景实测成本降低 83%。 原来首发期要 30 块钱干完的活，现在 5 块钱能干完。

三个维度对不同用户的影响：基础定价降低直接拉低了中小开发者的入场门槛，不用先说服老板批预算，可以从运营成本里直接覆盖；缓存机制的折扣在上下文复用场景下成本优势成倍放大；编程场景的针对性折扣，有助于锁定开发者社区，让 DeepSeek 在工具类场景的渗透率更高。

降价的底气来自两方面：训练和推理成本持续压缩，以及用户规模扩大后的边际摊薄。这不是赔本赚吆喝，而是以规模换利润的 SaaS 逻辑——单次调用利润降低，但总调用量的增长弥补了单位利润的损失。

[MEME: 谨慎]

主流大模型 API 定价对比横向柱状图，DeepSeek V4 对标 GPT-4o / Claude 3.5 Sonnet / 通义千问，单位 token 价格

四、DeepSeek 在做一件事：把大模型「不可能三角」压扁

把上面三件事放在一起看，会发现一个清晰的逻辑：

传统大模型竞争存在一个隐性"不可能三角"：能力更强 + 价格更低 + 服务更稳。三者天然互相拉扯——提升能力通常意味着更高算力消耗，压低价格压缩利润空间，扩大规模又可能影响服务质量。

DeepSeek V4 的破法是用架构效率松动三个角：

•多模态补全 → 图像理解补全后，V4 可进入文档处理、视觉问答等新场景，用户无需切换供应商
•工程稳定器 → "不崩"的价值在于帮企业客户省去大量运维和风控投入
•缓存机制 + 规模效应 → 缓存命中请求以一折计价，长对话和重复调用场景的成本优势成倍放大

不可能三角框架图，三个顶点分别标注"更强能力""更低价格""更稳服务"，中心箭头指向"架构效率提升"，形成破局路径

三个动作相互支撑，不是相互挤占。这让 DeepSeek V4 的竞争定位从"某个指标最强的模型"转向"最不容易出意外的模型"。对企业客户来说，这比纸面参数更有说服力。

值得留意的边界：

•识图模式的民间测试来自非正式评测，实际能力边界和边界情况尚未经过标准化基准验证
•83% 的编程成本降幅是单一场景的实测数据，不同使用模式下结果会有差异
•"工程稳定器"作为被挖出的技术细节，具体实现机制和量化指标未完全公开，对其战略价值的判断属于分析性推论，不是确认性信息
•"稳定性降低客户流失率 5% 可提升利润 25%-95%"是行业通用研究结论，非 DeepSeek 特定数据