Claude Opus 4.8发布:快模式降价3倍,性能接近Mythos级调优

Anthropic今日正式推出旗舰模型Claude Opus 4.8,该升级版与上一代定价保持一致,同时推出大幅降价的“快模式”层级,并新增支持生成数百个并行子智能体的功能,适用于代码库规模的任务。
该模型已通过Anthropic的多个平台(claude.ai、Claude Code、API及Cowork)上线,常规模式定价不变:输入令牌$5/百万,输出令牌$25/百万。开发者可通过claude-opus-4-8调用。
快模式:成本降至1/3,高吞吐推理触手可及
本次升级的核心亮点是“快模式”的降价——该模式下模型生成令牌速度约为常规的2.5倍,输入令牌降至$10/百万,输出令牌降至$50/百万,较上一代Opus 4.7的$30/$150价格降幅达3倍,让高吞吐推理更易应用于对延迟敏感的生产负载。
快模式已通过Claude Code的/fast命令开放,API访问需通过waitlist(claude.com/fast-mode)申请。
在常规模式下,Claude Opus 4.8虽仍属前沿模型中定价较高的产品,但低于主要竞品OpenAI的GPT-5.5。
前沿AI模型API定价快照
| 模型 | 输入($) | 输出($) | 总成本($) | 来源 |
|---|---|---|---|---|
| MiMo-V2.5 Flash | $0.10 | $0.30 | $0.40 | Xiaomi MiMo |
| MiniMax M2.7 | $0.30 | $1.20 | $1.50 | MiniMax |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | $1.75 | |
| MiMo-V2.5 | $0.40 | $2.00 | $2.40 | Xiaomi MiMo |
| Kimi-K2.6 | $0.95 | $4.00 | $4.95 | Moonshot/Kimi |
| GLM-5 | $1.00 | $3.20 | $4.20 | Z.ai |
| Grok 4.3 (low context) | $1.25 | $2.50 | $3.75 | xAI |
| DeepSeek V4 Pro | $1.74 | $3.48 | $5.22 | DeepSeek |
| GLM-5.1 | $1.40 | $4.40 | $5.80 | Z.ai |
| Claude Haiku 4.5 | $1.00 | $5.00 | $6.00 | Anthropic |
| Grok 4.3 (high context) | $2.50 | $5.00 | $7.50 | xAI |
| Qwen3.7-Max | $2.50 | $7.50 | $10.00 | Alibaba Cloud |
| Gemini 3.5 Flash | $1.50 | $9.00 | $10.50 | |
| Gemini 3.1 Pro Preview (≤200K) | $2.00 | $12.00 | $14.00 | |
| GPT-5.4 | $2.50 | $15.00 | $17.50 | OpenAI |
| Gemini 3.1 Pro Preview (>200K) | $4.00 | $18.00 | $22.00 | |
| Claude Opus 4.7 | $5.00 | $25.00 | $30.00 | Anthropic |
| Claude Opus 4.8 | $5.00 | $25.00 | $30.00 | Anthropic |
| GPT-5.5 | $5.00 | $30.00 | $35.00 | OpenAI |
性能提升:小幅进步但接近Mythos级能力
在基准测试中,Opus 4.8的表现较前代有所提升而非飞跃:SWE-bench Verified得分88.6%(Opus 4.7为87.6%),更难的SWE-bench Pro得69.2%(4.7为64.3%),Terminal-Bench 2.1得74.6%(4.7为66.1%)。Anthropic将其描述为“对前代的适度但切实的改进”。
该模型在至少12项基准测试中击败GPT-5.5,包括知识工作、编码(问题级)、代理工具使用及长上下文任务。GPT-5.5在终端/CLI工作流中占优,网页浏览和研究生级科学测试中两者持平。
更关键的是,Opus 4.8处于Anthropic内部能力梯队的中游——介于Opus 4.7和性能更强的Claude Mythos Preview之间。后者目前仅限Project Glasswing项目下的少数组织用于网络安全工作,Anthropic表示将在额外网络安全保障就位后“未来几周向所有客户推出Mythos级模型”。
企业合作伙伴已确认显著收益:Databricks称Opus 4.8在其Genie数据代理中“解锁了代理推理的飞跃”,因PDF和图表的多模态效率,令牌成本较4.7降低61%;Hebbia提到引用精度和令牌效率的提升;Devin开发者Cognition指出该模型“直接转化为工程师能力的更快提升”,并修复了4.7的注释冗长和工具调用问题;某计算机使用供应商报告Online-Mind2Web得分84%,超过Opus 4.7和GPT-5.5。
动态工作流:数百个并行子智能体协同处理大型任务
此次发布还推出了Claude Code中的“动态工作流”研究预览,专为单次上下文窗口无法处理的任务设计。该功能中,Claude规划工作、生成数百个并行子智能体,自行验证输出后反馈结果。例如,可完成“数十万行代码的代码库迁移,从启动到合并,以现有测试套件为基准”的任务。
动态工作流已开放给Claude Code的Enterprise、Team及Max计划用户。
此外,本次更新还包括两个小功能:
- Claude.ai与Claude Cowork中的努力控制:新增选择器让用户调整每次响应的思考量——更高的努力程度意味着更深入的分析。
- 其他细节优化:未在截断内容中明确,但原文提及“Effort control”为新增功能。
关注微信号:智享开源 ,及时了解更新信息。

关注微信

还没有任何评论,你来说两句吧!