智能体账单:企业面临AI成本危机

智能体账单:企业面临AI成本危机

AI成本激增引发行业警觉

当前,众多企业开始对AI应用的高成本望而却步。优步(Uber)在2026年4月便耗尽了全年AI编码预算;微软在启用数月后撤销了开发人员的Claude Code许可证;一位普林赛林(Priceline)员工透露,常规的Cursor合同续费价格飙升至原来的4-5倍。

尽管单个token的价格有所下降,但企业对AI应用的广泛追求以及日益自主化的智能体系统,使得token消耗量持续攀升。那些在2025年初大肆采用”无限量”订阅方案的企业,如今正忙于追踪资金流向、缩减开支,并试图从预算崩塌的残局中挽救部分投资回报。

市场涌现成本管控解决方案

与此同时,一股满足企业需求的市场力量正在形成。初创公司、成熟供应商以及新兴标准组织竞相提供工具和方法论,帮助企业追踪AI支出。

“六个月前,我与客户的对话总是围绕’它能做什么?效果够好吗?'”OpenAI企业业务主管亚历山大·恩比里科斯在纽约一场活动上向TechCrunch表示,”现在的对话完全变了,变成了’我们花得太多了。你们有什么可见性?审计能力?token控制措施?模型的效率如何?'”

Tokenomics基金会应运而生

在此背景下,Linux基金会本周宣布成立Tokenomics基金会,这一新标准组织旨在为AI token建立与FinOps对云支出相同的成本管理规范。

“在四五月间,我听到越来越多企业反馈:’天啊,我们的整个2026年token预算已经超支3倍,而且才四月而已,'”Linux基金会旗下的FinOps基金会执行董事J.R.斯托特门特表示,”我们开始听到企业面临生存危机,整个对话从’tokenmaxxing'(最大化使用token)和’快速行动’转向了’我们需要护栏,如何控制局面?'”

智能体应用激增导致成本失控

这些科技界的呼声紧随CEO们要求团队采用最佳模型、不计成本快速行动的指令之后。去年11月发布的新模型,如Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和谷歌的Gemini 3 Pro,显著提升了智能体工具的性能,同时也大幅增加了消耗量。有公司因未为员工设置使用限制,竟收到高达5亿美元的Claude账单。

企业应对措施

  • 普林赛林IT财务高级总监克里斯·里德将AI比作”可卡因流行病”,并表示公司已开始对特定团队设置token限额。
  • Faros AI首席执行官维塔利·戈登透露,一位CTO告诉他:”我的一个工程师上个月在token上花了4万美元,我真的不知道应该阻止他还是让其他人效仿他。”

智能体投入与产出不成正比

Faros AI在4月发布的针对2万名开发者的两年研究发现,尽管产出有所提升,但代码错误和重写数量也随之增加。Jellyfish工程管理平台发现,使用最多AI的工程师生产力约为较少使用AI同事的两倍,但他们为此消耗的token数量却是后者的10倍。

Jellyfish研究主管尼古拉斯·阿尔科拉诺通过电子邮件向TechCrunch指出,智能体功能的引入是AI支出爆炸性增长的主要原因,每个开发者的消耗量在九个月内上升了约18.6倍。总的来说,这些统计数据使生产力的论调比支出数据所显示的更加模糊。

“极端支出是否值得,最终取决于已发布代码的商业价值(如收入),而大多数公司仍无法衡量这一点,”阿尔科拉诺说。

成本监控面临技术挑战

至少部分测量难题源于当今AI使用的庞大规模。

“跟踪云成本是每月处理数亿行数据的问题,而跟踪token成本是每月处理万亿行数据的问题,”斯托特门特表示,”你不能简单地将这些数据放入任何电子表格或基础工具中。你必须从根本上重新思考你的工具、规范和会计系统。”

在普林赛林,里德已经发现了数据不一致的问题。他指出供应商报告的使用量与公司内部数据存在差异。

“我的职业生涯始于电信费用管理,现在我在电信、云和AI领域看到了所有相同的平行线,”他说,”每当引入新技术时,都容易出现计费错误、审计和优化机会。”

新兴市场与解决方案

围绕这一问题,一个新兴市场正在形成。包括Pay-i在内的专业公司应运而生,它们跟踪、测量和优化GenAI投资的成本与性能。


关注微信号:智享开源 ,及时了解更新信息。

原文链接:https://techcrunch.com/2026/06/05/the-token-bill-comes-due-inside-the-industry-scramble-to-manage-ais-runaway-costs/

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章1291篇


关注微信

分类