智能体AI落地见效,默克万事达卡强调基建先行

默克的智能体AI实践:基建先行
默克通过智能体AI将药物发现周期缩短三分之一,合规营销材料交付速度提升70%至80%,但数字平台副总裁肖恩·芬纳蒂(Sean Finnerty)指出,这一切成功的关键在于公司先构建了底层基础设施。
默克已取得初步成效:AI生成的营销草稿合规性达“99%正确”,将审核周期从数月压缩至数天,交付速度提升70%至80%。在医学研究中,一个AI辅助的发现周期也减少了33%。
芬纳蒂在最近一场AI影响系列活动中强调,智能体AI的有效性依赖于企业先搭建好底层“ plumbing”(基础设施)。“如果零敲碎打地做项目,最终会堆积成千上万个需要后续处理的‘技术债务’,这会拖累未来的创新。”
从云时代到AI时代的基建经验
默克的“基建优先”策略源于2010年代云计算早期的教训。“当时没人清楚状况,只能从零开始构建。”芬纳蒂说。如今,默克的云基础设施已支持2,500个AWS账户、多个微软Azure订阅及谷歌云平台(GCP)集成。
“AI将面临同样的问题——我们将拥有成千上万个智能体。”芬纳蒂指出,随之而来的是注册、安全、工具连接、数据访问等挑战。“如何确保它们获取正确的上下文?”
上下文传递至关重要。默克与三大云服务商合作,拥有47个边缘节点和数百个数据库,存储着“海量拍字节”的结构化与非结构化数据(如Oracle数据库、SQL数据库、Excel表格、电话记录等)。“数据必须被组织和整合到不同平台,因为‘没有万能解决方案’。”芬纳蒂解释,有时用Databricks,有时用Amazon Redshift,“还需结合其他工具”。
团队正在构建“脚手架”以在不同场景中传递有效上下文,目标是“让操作更简单、无摩擦,同时确保安全,并与MCP(模型上下文协议)、A2A(智能体间通信)及上游计算良好集成”。“无论想在GCP还是AWS运行工作负载,我们的基建都已就位。”
智能体在默克的多场景应用
在构建技术基建的同时,默克在受监管的企业运营、科学发现流程和应用现代化中试验智能体。
- 药物研发加速:科学家通过分析分子结构与疾病状态判断靶点可药性,但药物开发常需数年。AI将一个研究周期缩短三分之一,“相当于将药物发现周期缩短一年,理论上能让患者更早获得所需疗法。”
- 合规营销优化:药品上市后,营销材料需严格符合各国法规(如美国佐治亚州的疫苗广告与加拿大的不同)。过去人工审核需数月迭代,如今AI在人类监督下,一天或一周内生成99%合规的草稿,交付速度提升80%。
- 应用现代化:智能体可自动发现架构、记录数据交互、API、网络路径,执行身份验证和授权,甚至用Terraform编写部署代码、将JavaScript重构为Python。“过去更新一个应用需数周、数月及数十万美元,现在通过提示词即可让智能体完成。”
挑战与解决方案:“幻觉”与监督机制
智能体应用并非一帆风顺。芬纳蒂团队遇到过“离奇状况”:AI在自动化代码和场景测试中编造不存在的场景,或因上下文错误、基础设施问题“过度发挥”。
“这让我惊讶,原以为后期模型已克服‘幻觉’问题。”他坦言。团队通过“AI监督AI”和置信度评分应对:若Claude生成初稿,再用Microsoft Copilot评估,多次验证后置信度提升,减少早期错误。
万事达卡的智能体AI探索:金融场景应用
万事达卡首席数据官安德鲁·雷斯金德(Andrew Reiskind)团队则聚焦交易和纠纷处理的智能体实验。交易纠纷(如盗刷争议)并非单一事件,而是涉及消费者、商家、网络的复杂流程。
当消费者在线发起争议,后台会触发劳动密集型流程:万事达卡需收集争议细节,商家需调查(如卡片是否被盗、消费者是否频繁争议),网络则有自身规则。其中,卡片状态(如是否被盗)是结构化数据,而消费者投诉则是“可靠性存疑的非结构化数据”。
“决策系统既有确定性判断,也有概率性判断。”雷斯金德说。智能体可加速这一流程,但需解决任务分配、人机协同、成本及声誉风险等问题:“如何避免误判消费者为‘说谎者’,同时保持信任、提升效率、降低成本?”
这体现了金融领域智能体AI的核心挑战:在效率与信任间找到平衡,确保自动化处理不损害消费者关系。
关注微信号:智享开源 ,及时了解更新信息。

关注微信

还没有任何评论,你来说两句吧!