亚马逊可信智能体工程框架亮相

智能体自主执行能力提升,企业权限授予仍显谨慎
人工智能智能体在自主完成商业任务方面能力日益增强,然而IT领导者对于允许这些智能体访问企业系统仍持保留态度。这种谨慎态度部分源于当前AI可靠性的评估方式存在局限性。
可靠性评估的挑战
亚马逊AGI自主研究实验室主任布莱恩·西尔弗索恩(Bryan Silverthorn)指出,行业常用的可靠性评估标准往往依赖EVAL分数,这些指标仅能提供系统性能的静态快照,而非整体可靠性的全面度量。这种评估方式难以捕捉智能体在不同提示、环境和输入类型下的可预测表现。
亚马逊的创新框架
在即将举行的VB Transform 2026大会前夕的采访中,西尔弗索恩透露,亚马逊的AGI自主研究实验室正在摒弃单一的基准测试方法,转而构建一个以一致性、鲁棒性、可预测性和安全性为核心的结构化框架。
解耦系统的安全策略
与传统将AI模型强行纳入安全控制的方式不同,亚马逊强调采用解耦系统架构。例如在沙盒环境中,智能体提出的系统变更将由人类专家审核批准后才能实施。这一策略特别适用于金融等高度敏感领域,通过确保每一步交互都可验证来建立信任。
企业信任度调查数据
根据VentureBeat对100多名高级技术决策者的第二季度调研结果,仅有4%的受访者表示可以完全依赖模型内置的安全护栏。当被问及最担忧的安全问题时:
- 40%的人担心智能体会未经授权访问工具或数据
- 27%的人关注提示操纵或注入攻击
大会分享内容
在VB Transform大会上,西尔弗索恩将详细介绍亚马逊构建可信智能体AI的完整方案,并指导企业如何从单一智能体设计过渡到能够自主纠错的多工具架构体系。他的演讲主题为”弥合能力与可靠性差距:亚马逊可信智能体工程框架内幕”。
同期还将举行另一场聚焦智能体操作与评估的专题会议,Waymo系统智能与机器学习总监曼西·乔希(Manasi Joshi)将分享题为”规模化智能:Waymo如何为物理世界构建安全高效的AI”的内容。
关注微信号:智享开源 ,及时了解更新信息。

关注微信

还没有任何评论,你来说两句吧!