OpenAI升级GPT-5.5:购物理解与意图识别能力大增

OpenAI升级GPT-5.5:购物理解与意图识别能力大增

OpenAI对其应用最广泛的语言模型GPT-5.5 Instant进行了重大更新,该模型是ChatGPT免费版本的默认模型。该公司昨日通过X平台宣布了GPT-5.5 Instant的升级版本,称其”交流起来更有趣”,在”理解问题背后的意图并相应调整回答”方面有所改进,同时在购物结果、本地推荐以及处理”复杂约束”等方面也取得了进步。

然而,OpenAI尚未提供任何基准测试或数值结果来量化这些声明。该公司表示,升级后的GPT-5.5 Instant首先向付费ChatGPT用户推出,并于6月25日开始向免费用户提供。

OpenAI还更新了其chat-latest API别名,该别名指向当前在ChatGPT中使用的最新GPT-5.5 Instant模型,同时继续建议在生产API使用中采用独立的gpt-5.5模型。

这种区别很重要,但它不应掩盖主要新闻:这主要是针对ChatGPT的GPT-5.5 Instant更新,而非整个GPT-5.5 API模型家族的新版本。

GPT-5.5 Instant的起源及为何在不到两个月后更新

GPT-5.5 Instant最初于2026年5月初发布,距今不到两个月,旨在取代老旧的GPT-5.3 Instant引擎,成为ChatGPT用户的默认基础模型。

作为OpenAI核心旗舰模型家族的快速、高吞吐量变体,最初的春季发布重点在于纠正系统事实性缺陷。

根据当时春季部署的内部基准测试,与GPT-5.3 Instant相比,在医疗、法律和金融等高利害关系提示下,幻觉声明减少了52.5%,在用户标记的历史对话中事实错误率下降了37.3%。

独立评估者注意到,其前身GPT-5.3 Instant在公开排名中表现不佳,在Arena基准测试中总体排名第44位。这使5月的发布有了明确目的:OpenAI需要一个更强大的日常ChatGPT交互的默认模型,而不仅仅是针对高级用户的更前沿模型。

从风格上看,最初的春季模型引入了更锐利的对话基准,在典型提示建议中字数减少了30.2%,行使用率下降了29.2%。

然而,春季部署也为企业软件系统引入了一个操作故障线:一项被称为”记忆源”的功能。该功能旨在让用户了解塑造个性化回答的具体过去聊天、文件和连接的Gmail账户,记忆源引入了一个松散的、模型报告的可见性层。

据VentureBeat报道,这些内部摘要经常与本地向量数据库和企业检索增强生成(RAG)管道的确定性日志相冲突。

由此产生的摩擦造成了双重、竞争性的上下文记录,使管理员难以调和模型声称引用的内容与实际在生产环境中访问的内容。

6月24日的更新似乎没有直接扩展记忆源功能。相反,它专注于使GPT-5.5 Instant更好地理解用户意图,在对话中保持上下文,遵循多部分指令,并产生更有用的购物和本地推荐。

面向消费者的更智能、更有趣的ChatGPT

对于ChatGPT的日常用户来说,GPT-5.5 Instant最明显的变化是其改进的意图识别能力。

根据OpenAI的最新发布说明,GPT-5.5 Instant在识别问题背后的潜在目标方面有所提高,特别是在规划、购物、寻求建议、研究选项和比较本地选择等决策支持场景中。

历史上,大型语言模型在处理具有多个重叠约束的提示时往往表现不佳——通常会放弃一两个要求,转而提供通用回答。

升级后的GPT-5.5 Instant能更可靠地处理这些复杂指令。当用户对答案提出异议、澄清含义或在对话中引入新约束时,模型应该动态调整,而不是固执地重复其原始方法。

这种上下文意识在商务和本地推荐方面得到了广泛应用。GPT-5.5 Instant现在能更好地利用位置上下文来展示附近的选项,在有用的情况下,将产品推荐、商业信息和相关图像整合成更连贯的输出。

此外,OpenAI指出,这些回答的风格格式不再严格模板化,用精心设计、更温暖且克制的对话语调取代了机械化的列表形式。

开发者可通过chat-latest API测试最新功能

对于开发者生态系统,6月24日GPT-5.5 Instant的更新可通过OpenAI更新的chat-latest API别名访问。

chat-latest与生产gpt-5.5模型标记不同。OpenAI表示,chat-latest指向当前在ChatGPT中使用的最新即时模型,并建议在生产API使用中采用独立的gpt-5.5模型。开发者可以使用chat-latest测试最新的ChatGPT风格改进,而在需要稳定生产目标时使用gpt-5.5。

当前的chat-latest模型页面列出了400,000个token的上下文窗口和最高128,000个输出token的支持。其知识截止日期为2025年8月31日。

在定价方面,chat-latest使用模型页面上列出的相同费率:输入token每100万token收费5.00美元,输出token每100万token收费30.00美元。缓存输入成本为每100万token 0.50美元,提供90%的折扣,强烈鼓励开发者通过将静态指令放在前面、动态数据放在后面来优化提示。

该模型支持文本和图像输入、文本输出、流式传输、函数调用和结构化输出。通过Responses API,chat-latest页面还列出了对网络搜索、文件搜索、图像生成、代码解释器和MCP的支持。

实际应用很简单:chat-latest让开发者可以访问更新的即时风格行为,但OpenAI仍引导生产API构建者使用独立的gpt-5.5模型。更广泛的GPT-5.5 API模型包含更多功能集和不同的生产配置文件,但这不是此次更新的重点。

为何这对企业AI团队很重要

对于企业而言,6月24日GPT-5.5 Instant的更新出现在两个相关但不同的趋势交汇点:ChatGPT中更好的默认用户体验,以及API中更可靠的编排行为。

面向消费者的变化使ChatGPT在日常决策中更有用。用户应该能看到对混乱现实世界请求的更好处理:规划具有多个约束的旅行、比较产品、寻找附近的企业,或在添加新要求后调整推荐。

企业的相关性较少涉及新的技术架构,更多关乎默认行为。能够更好地推断意图、保留对话上下文并适应不断变化需求的模型,为企业使用提供了更坚实的基础。

对于企业AI团队来说,此次更新的关键价值在于提供了一个更可靠的基础模型,该模型能够更好地处理现实世界中的复杂请求,同时在API环境中保持足够的稳定性,适合企业应用场景。


关注微信号:智享开源 ,及时了解更新信息。

原文链接:https://venturebeat.com/technology/openais-updated-gpt-5-5-instant-is-better-at-shopping-complex-constraints-and-understanding-user-intent-and-its-already-in-the-api

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章1642篇


关注微信

分类