HarnessX:AI智能体的自适应革命

HarnessX:AI智能体的自适应革命

支撑工程面临的挑战

在人工智能应用中,基础模型的能力高度依赖于其支撑架构(harness)。这一架构作为操作层,将原始模型输出转化为结构化的智能体行为。它包含提示词、外部工具集成、内存管理和控制流等要素,决定了AI系统如何观察环境、分析问题并采取行动。

随着企业智能体承担越来越复杂的长期工作流程,支撑工程已成为AI开发的重要组成部分。然而,尽管支撑工程至关重要,它远未成为成熟的工程学科,面临三大关键挑战:

  • 静态与手工构建:任何基础模型的变动、新工具的引入或运营领域的转变,都需要定制化的手动代码重写。传统支撑架构缺乏从执行经验中自主学习和改进的机制。
  • 架构耦合问题:大多数现有支撑架构将提示模板、工具包装器、重试策略和内存管理紧密耦合在同一代码路径中。这种耦合意味着调整一个组件可能会无意中破坏其他组件。跨不同业务领域重用支撑架构往往沦为原始代码复制,而非干净、模块化的组合。
  • 孤立优化:支撑架构和基础模型被分开优化。当工程师运行测试以改进支撑架构时,生成的执行轨迹通常被丢弃,而非用作改进模型的训练数据。因此,模型升级自然不会带来支撑架构的改进,形成瓶颈,导致团队无法捕获其智能体运营数据的全部价值。

HarnessX:智能体自主进化工厂

为解决手动支撑开发的工程瓶颈,小米研究人员引入了HarnessX,他们称之为”统一支撑工厂”。

HarnessX的核心创新是将支撑架构视为”一等公民对象”。在软件工程术语中,这意味着支撑架构是可独立序列化、模块化和可替换的实体。通过分离模型配置(即运行哪个AI模型)与支撑架构配置,工程师可以无缝交换、调整和演进这个框架,而无需触碰底层模型。

HarnessX将智能体行为分解为不同组件,如上下文组装、内存管理、工具生态系统、控制流和可观测性。每种具体行为都作为”处理器”实现,插入支撑架构的精确生命周期钩子中。这种模块化结构允许系统在不破坏周围管道的情况下交换、添加或删除这些处理器。

AEGIS:自主优化引擎

为自动化优化这一模块化结构,HarnessX引入了AEGIS,一种基于轨迹的进化引擎。AEGIS将支撑架构适应视为其不同符号组件的强化学习(RL)问题。

将支撑优化视为强化学习问题引入了三种病理现象,研究人员必须明确设计对策:

  • 奖励黑客:系统可能利用捷径解决问题,而非真正完成任务。
  • 灾难性遗忘:修复某一领域失败模式的编辑可能会无意中破坏已解决的工作流程。
  • 探索不足:系统可能只迭代微小的提示调整,而非探索新的、结构上更优越的工具配置。

为防止这些问题,AEGIS依赖于完全的轨迹可观测性和四阶段管道:

  1. 消化器:将执行轨迹压缩为结构化摘要,以识别智能体失败的位置。
  2. 规划器:分析这些摘要,使系统能够探索结构变化而非仅进行局部提示调整。
  3. 进化器:生成代码级别的支撑架构编辑并进行测试,确保在部署前正确运行。
  4. 评判与门控:评判者评估编辑以检测奖励黑客,而确定性门控拒绝任何导致已解决问题退化的更新,防止灾难性遗忘。

支撑-模型协同进化

HarnessX在日益增长的自改进支撑研究领域中脱颖而出,其独特之处在于支撑-模型协同进化。

研究人员强调,孤立优化任一组件最终都会遭遇瓶颈。仅演进支撑架构,如果底层模型缺乏使用新工具的推理能力,将遇到架构天花板;仅训练模型,如果支撑架构从不提示模型使用其高级能力,将遇到训练信号天花板。

HarnessX将支撑演进与模型训练交错进行。当支撑架构尝试适应任务时生成的执行轨迹,被转化为基础模型的强化学习信号。每次支撑架构改进其策略时,模型同时学习更好地利用该新策略,打破了传统AI智能体开发的能力天花板。

行业基准测试中的表现

为验证HarnessX的实际效用,研究人员在五个基准上测试了其效果,涵盖软件工程、多轮客户服务对话、网络导航和开放式多任务执行等场景。测试结果表明,HarnessX在15个模型-基准组合中平均带来14.5%的性能提升;对于开放权重模型Qwen3.5-9B,在具身规划任务上的性能提升高达44%。

这些结果证明,扩展基础模型并非提升AI能力的唯一途径,对于较小模型而言,甚至可能不是最佳选择。HarnessX的支撑架构演进为AI系统提供了动态适应特定应用需求的能力,在多个实际企业应用中展现出显著的性能提升。


关注微信号:智享开源 ,及时了解更新信息。

原文链接:https://venturebeat.com/orchestration/xiaomis-harnessx-rewrites-its-own-ai-scaffolding-mid-task-and-smaller-models-gain-the-most

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章1609篇


关注微信

分类