AI每次干活比你想象贵10倍,SaaS要重新定价了 AI每次干活比你想象贵10倍,SaaS要重新定价了
创始人
2026-04-28 08:14:37
0


DeepSeek V4发布后,海外开发者社区里出现了一批令人不安的讨论。不是关于幻觉率,也不是关于排名——而是关于账单。

有开发者在社区反映:「用V4跑了一个Agent任务,Token消耗是V3的8倍。」这个方向上,多位开发者有类似反馈:AI从「问答」进入「自主行动」阶段,Token消耗量的量级在发生变化。

量级变了,意味着什么?意味着很多公司原本的商业模式,可能需要重算一遍。

Agent时代的Token消耗,和你想象的不一样

在传统「问答式」AI场景里,一次对话的Token消耗大概在数百到数千个。用户提问,模型回答,结束。这个量级对应的API成本是每次几分钱到几毛钱,相当可控。

但Agent模式完全不同。一个Agent任务,需要模型自主规划→搜索信息→调用工具→执行步骤→验证结果,整个流程下来Token消耗可能达到数万甚至数十万。这不是线性增长,是数量级的跳跃。

▸ DeepSeek V4 Agent任务评测:开源模型中排名第一(来源:东方财富,2026年4月27日)

▸ V4单次Agent任务Token消耗:据多位开发者社区反馈,实测增幅在5至10倍区间(本报道无法独立核实,仅供参考)

▸ AI数据中心CPU与GPU配比演变趋势:从当前约1:4—1:8,向Agent时代约1:1—1:2演进(来源:TrendForce,2026年4月)

▸ OpenClaw全面适配DeepSeek V4 Flash和Pro两个版本(来源:东方财富,2026年4月27日)

TrendForce的数据可以从侧面印证这一趋势:AI数据中心CPU与GPU配比,正在从当前的1:4至1:8,向Agent时代的1:1至1:2演进。CPU重新变得稀缺,正是因为Agent任务对调度层的要求大幅提升。Token消耗量上涨,和CPU需求上涨,是同一件事的两个面。

三类公司,三种不同的冲击

▍第一类:按「次数」收费的SaaS产品——定价模型亟需重构

这类产品过去的定价逻辑是:用户每月付固定月费,可以「按次数」使用AI功能。这个模型在问答时代是合理的,因为单次成本可控。但进入Agent时代,一次「帮我完成这个任务」的请求,可能消耗的Token相当于过去100次问答,而向用户收取的费用还是「一次」。利润率将持续受压,直到公司重新设计定价结构——比如按「任务复杂度」分级计费,或按Token消耗量直接穿透给用户。

▍第二类:API提供商——账单变大,但要警惕用户关闸

对于Anthropic、DeepSeek、OpenAI等API提供商,Token消耗量上升是好消息,API收入直接与Token挂钩。但存在一个潜在的临界点:如果单次任务成本显著超出用户预期,用户可能选择降低调用频率,或自建更轻量的模型做前期过滤,只把真正复杂的任务交给大模型。

▍第三类:「Token优化」赛道——一个正在形成的新机会

当Token成本成为AI应用公司的关键财务指标,就会有人专门做「如何用更少Token完成同等任务」的工具。这个赛道在云计算时代叫「FinOps(成本优化)」,在AI时代对应的可能是「Prompt压缩」「Context剪枝」「任务拆解优化」等方向。这个需求从理论变成现实的速度,可能比很多人预期的更快。

对中国AI创业公司意味着什么?

国内AI应用公司大多还处于早期增长阶段,用户规模快速扩张时,Token成本往往不是第一关注点。但这个问题早晚会来:当月活用户从10万增长到100万,如果每个用户开始使用Agent功能,API成本曲线的斜率会发生质变。

在融资模型设计上,这意味着需要把「用户增长」和「API成本增长」分开建模,而不是简单地假设两者线性关系。「每用户平均Token消耗」(Token per MAU)可能会成为一个新的关键分析指标,帮助观察者更清晰地评估真实成本结构。

这不是AI变贵了,这是AI开始「干活」了。

DeepSeek V4 Agent任务排名开源第一,这是能力的里程碑。但随之而来的Token消耗问题,是商业模式的考题。能力提升是确定的,商业模式怎么跟上,是接下来12个月AI应用公司最需要回答的问题。

你用的AI,每次「干活」可能比你想象的贵10倍。 SaaS公司的问题是:这个账,谁来付?

作者:书言

【免责声明】本文仅为信息分享与行业分析,不构成任何投资建议、投资分析意见或交易邀约。市场有风险,投资需谨慎。任何人依据本文内容作出的投资决策,风险与盈亏自行承担,作者及发布平台不承担任何法律责任。

信息来源

1. 东方财富:《孔明直播:4月27日市场热点追踪——OpenClaw接入DeepSeek V4》(2026年4月26日)

2. TrendForce:《AI数据中心CPU与GPU配比演变趋势报告》(2026年4月)

3. DoNews:《英特尔财报超预期引爆CPU涨价潮,AI智能体时代推升CPU需求》(2026年4月24日)

相关内容

热门资讯

北方华创,巨额商誉压力突然高悬... 文丨詹詹编辑丨百进来源丨新商悟(本文约为 1300字)当国内半导体设备龙头北方华创交出一份“营收创历...
长城华西银行原女掌门已回老东家... 湘财Plus注意到,四川银行入主长城华西银行后,该行核心管理人员调整基本落定,法定代表人已正式变更为...
立案,跌停!这家“童年记忆”,... 沉浮多年,方向何在?最近被立案的上市公司,着实有些多,就在上周末,又有一家上市公司及原董事长被立案调...
加码生态环境监测!生态环境部:... 本文来源:时代周报 作者:李杭4月27日,生态环境部举行4月例行新闻发布会。 生态环境部4月例行新...
东方甄选主播“离职潮”持续发酵... 红星资本局4月27日消息,东方甄选(01797.HK)主播“离职潮”事件仍在发酵。在社交平台上,有部...
SpaceX万亿IPO前夜:马... 从20亿美元收购,到万亿IPO前的最后叙事。2026年4月23日深夜,特斯拉向SEC提交了一份季报文...
前董事长陆宏达“闪电辞职”牵扯... 紧急澄清前董事长性侵指控后,智度股份仍难挡股价大跌。4月27日,智度股份早盘一度重挫逾9%,逼近6....
高盛:一场全球性化工危机正在爆... 霍尔木兹海峡通行受阻,正在引发一场史无前例的全球化工供应冲击。高盛最新报告表示,基础化工品价格近几周...
这笔400亿,谷歌买的不是友谊... 4月25日,Anthropic宣布谷歌将向其投资最高400亿美元——先期注入100亿美元现金,估值3...
粪坑,爬出来了 粪坑,爬出来了... 图:Simon Bailly 读者说:“有人发现吗?2019年蚂蚁的大热基金鹏华快回本了,当年最高回...