企业AI的运行时危机与模型误区

Mark Do 暂无评论阅读 91 次

2026年第一季度的Pulse研究表明，企业面临着一个严峻的”治理幻象”——即企业所构建的治理组织架构与实际控制层之间的巨大差距。调查显示，43%的企业表示由中央团队负责AI治理；23%的企业完全无法就治理责任达成一致；而31%的企业则认为供应商不透明是最大的障碍。

这项新的研究进一步探讨了一个关键问题：在承认治理问题后，当企业尝试解决时，最先会出现什么故障？调查结果明确指出，失败点不在于模型，而在于运行时。

企业AI的运行时危机与模型误区

企业逐渐认识到，基于无状态基础设施构建的智能体——如Python脚本、LangChain链和临时编排系统——无法应对生产环境的实际运营需求。容器重启会擦除上下文，令牌成本超出业务预期，第3步的幻觉到第12步会演变成灾难性故障。更令人担忧的是，大多数工程团队花费了大量时间来管理这些”基础设施”，而非构建那些本应证明投资合理性的智能功能。

本次调查揭示了一个行业面临的关键抉择。能够经受住智能体革命考验的组织，将是那些将运行时耐用性视为首要工程问题的企业，而不是仅仅通过重试和提示来修补的次要考虑。未能做到这一点的组织，将发现自己回到了十年前RPA留给企业的境地：一个无法存活的试点项目墓地。

研究方法

2026年5月，VentureBeat作为其持续进行的Pulse研究系列的一部分，开展了此项调查，主题为企业环境中智能体AI的采用情况。受访者筛选标准为企业员工数不少于100人的组织。最终合格的样本由132名经验丰富的技术领导者组成，他们都在企业智能体AI部署的前沿。

受访者涵盖以下职位：

AI/分析总监 (8%)	工程/IT总监 (16%)
数据/AI/分析副总裁 (5%)	工程/IT副总裁 (5%)
CIO/CTO/CISO (15%)	产品与项目经理 (13%)
顾问 (9%)	软件与机器学习工程师 (9%)
企业架构师 (8%)	其他 (12%)

受访者所在的行业包括：技术/软件(42%)、金融服务(20%)、专业服务(8%)、医疗/生命科学(7%)、零售/消费品(6%)、教育(4%)及其他行业。

基于我们的严格筛选标准，这一群体为新兴智能体基础设施趋势提供了权威而全面的视角。

按公司规模划分的受访者人口统计：

大型企业(10,000+员工)： 样本的35%
中大型企业(500-9,999员工)： 样本的48%
成长型企业(100-499员工)： 样本的17%

这些定量发现捕捉了基础设施演变的关键时刻，最好与VentureBeat 2026年第一季度的治理报告以及我们在整个季度进行的深度实践者对话一起综合分析。

发现一：运行时是问题所在

“大脑与脊柱”的辩论已经结束

2026年企业AI的基础性问题是，智能体失败是否源于模型的推理能力——即”大脑”，还是源于运行时基础设施无法管理状态、处理故障和协调执行——即”脊柱”。我们直接询问了受访者。

集成/治理挑战是最大的问题，但脊柱问题紧随其后。

然而，仍有17%的受访者表示”大脑”是主要的故障模式。这不是一个小错误——这是一个信号。这一群体中的企业并非在质疑基础设施问题；他们告诉我们，模型本身对于其工作流程产生的边缘情况还不够可靠。模型与运行时的辩论实际上是三方面的。综合来看，这三个答案并不完全冲突。”脊柱”和”差距”阵营分别正在应对基础设施和治理问题，而”大脑”阵营则在上游遇到挑战：大规模推理的可靠性。

这是一个重要发现。前沿模型之争——GPT-5与Claude 4.7与Grok——在企业技术媒体中占据了巨大的注意力。我们的受访者告诉我们，这场战争目前而言是次要的。模型已经足够智能，但围绕它们的基础设施却不是。

“模型已经足够智能，但我们的无状态基础设施过于脆弱，无法管理长期运行的、多步骤的智能体过程。”

— 工程/IT总监，金融服务公司，10,000-49,999名员工

发现二：DIY税正在吞噬团队

工程能力被基础设施而非智能所消耗

如果”脊柱”是主要故障模式，那么这在实践中会带来什么成本？我们询问受访者，他们团队每周有多少工程能力被用于构建和维护自定义的”基础设施”——手动重试、状态持久化、检查点，而不是实际的智能体逻辑。

结果显示市场分为两个截然不同的阵营，中间存在一个危险的区域。

计算结果令人震惊。77%的受访者花费了大量的工程时间在基础设施开销上。只有23%——那些其框架能够处理可靠性的受访者——已经摆脱了这种税。分布相当平缓：危机区和效率区与中间类别（陷阱区和维护税区）大小相同。这是一个部分解决了最严重故障但尚未摆脱结构性开销的市场的标志。

效率区的受访者不一定处于更先进的位置。在许多情况下，他们可能使用的是抽象化了耐用性问题的托管平台——或者他们可能尚未达到无状态架构开始失效的规模。复杂性陷阱通常是效率区的终点。

对于处于危机区的组织来说，有直接的商业后果。每个编写重试逻辑或调试”幽灵失败”——无声的API超时使智能体挂起且没有回溯信息——所花费的工程小时，都是没有投入到本应证明AI投资价值的差异化逻辑中的小时。

发现三：状态健忘是生产环境的杀手

首要技术障碍已经转变：成本和幻觉现在领先于状态故障

当智能体无法达到生产环境或扩展规模时，主要的技术障碍是什么？我们列出了五个候选因素，从模型幻觉到成本超支，再到延迟故障。

以24%的”幻觉传播”会静默累积——早期步骤的推理错误到第10步会演变成灾难。20%的”幽灵故障”按定义是不可见的，这意味着它们的实际发生率可能比这个数字显示的更高。

发现四：可观测性税对微软的冲击最大

平台可见性成本并非平均分布

我们在2026年第一季度的研究确定了供应商不透明是AI治理的最大障碍——超过了人才缺口、工具和预算。这一发现引出了这个问题：在实践中，哪个供应商生态系统为实现基本的生产可见性付出了最高成本？

在调查中，我们询问了受访者不同技术栈的运行时可观测性挑战。结果显示，微软生态系统在实现端到端可见性方面面临最大困难。这主要是因为微软的AI服务分散在多个产品线中，包括Azure AI、Power Platform和Microsoft 365 Copilot，这些服务之间缺乏统一的监控和日志系统。

相比之下，基于AWS和Google Cloud的解决方案提供了更集成的监控工具，但它们也面临着自己的挑战，特别是在跨服务协调和成本管理方面。开源解决方案虽然提供了最大的灵活性，但需要更多的工程专业知识来配置和维护。

“微软的智能体生态系统功能强大，但将不同的服务连接起来形成统一的监控视图是一场噩梦。每个服务都有自己的日志格式和API，我们需要编写大量的自定义代码才能获得完整的图景。”

— AI架构师，大型科技公司

发现五：组织结构决定智能体成熟度

集中式与分散式治理各有利弊

我们还研究了组织结构如何影响智能体项目的成功。数据显示，采用混合模式——核心智能体能力集中管理，特定业务领域的应用分散开发——的组织在运行时稳定性和业务价值实现方面表现最佳。

完全集中式的模式往往导致创新速度减慢，而完全分散式的模式则可能导致重复工作和不一致的标准。最佳的平衡点是建立一个强大的中心团队提供基础架构和治理框架，同时允许业务部门在其范围内进行创新。

值得注意的是，无论采用哪种组织模式，成功的企业都有一个共同点：他们都将智能体运行时视为一等工程问题，而不是事后才考虑的次要问题。这些组织通常设有专门的”智能体运行时工程师”角色，负责确保生产环境中的可靠性和性能。

关注微信号：智享开源 ，及时了解更新信息。

原文链接：https://venturebeat.com/resources/the-agentic-reckoning-enterprise-ai-organizations-have-a-runtime-problem-not-a-model-problem

0 0

企业AI的运行时危机与模型误区

研究方法

发现一：运行时是问题所在

发现二：DIY税正在吞噬团队

发现三：状态健忘是生产环境的杀手

发现四：可观测性税对微软的冲击最大

发现五：组织结构决定智能体成熟度

评论列表

发表评论

为你推荐

近期文章

标签

近期评论

分类

热门文章