Claude Opus 4.8发布:快模式降价3倍,性能接近Mythos级调优

Anthropic今日正式推出旗舰模型Claude Opus 4.8,该升级版与上一代定价保持一致,同时推出大幅降价的“快模式”层级,并新增支持生成数百个并行子智能体的功能,适用于代码库规模的任务。

该模型已通过Anthropic的多个平台(claude.ai、Claude Code、API及Cowork)上线,常规模式定价不变:输入令牌$5/百万,输出令牌$25/百万。开发者可通过claude-opus-4-8调用。

快模式:成本降至1/3,高吞吐推理触手可及

本次升级的核心亮点是“快模式”的降价——该模式下模型生成令牌速度约为常规的2.5倍,输入令牌降至$10/百万,输出令牌降至$50/百万,较上一代Opus 4.7的$30/$150价格降幅达3倍,让高吞吐推理更易应用于对延迟敏感的生产负载。

快模式已通过Claude Code的/fast命令开放,API访问需通过waitlist(claude.com/fast-mode)申请。

在常规模式下,Claude Opus 4.8虽仍属前沿模型中定价较高的产品,但低于主要竞品OpenAI的GPT-5.5。

前沿AI模型API定价快照

模型 输入($) 输出($) 总成本($) 来源
MiMo-V2.5 Flash $0.10 $0.30 $0.40 Xiaomi MiMo
MiniMax M2.7 $0.30 $1.20 $1.50 MiniMax
Gemini 3.1 Flash-Lite $0.25 $1.50 $1.75 Google
MiMo-V2.5 $0.40 $2.00 $2.40 Xiaomi MiMo
Kimi-K2.6 $0.95 $4.00 $4.95 Moonshot/Kimi
GLM-5 $1.00 $3.20 $4.20 Z.ai
Grok 4.3 (low context) $1.25 $2.50 $3.75 xAI
DeepSeek V4 Pro $1.74 $3.48 $5.22 DeepSeek
GLM-5.1 $1.40 $4.40 $5.80 Z.ai
Claude Haiku 4.5 $1.00 $5.00 $6.00 Anthropic
Grok 4.3 (high context) $2.50 $5.00 $7.50 xAI
Qwen3.7-Max $2.50 $7.50 $10.00 Alibaba Cloud
Gemini 3.5 Flash $1.50 $9.00 $10.50 Google
Gemini 3.1 Pro Preview (≤200K) $2.00 $12.00 $14.00 Google
GPT-5.4 $2.50 $15.00 $17.50 OpenAI
Gemini 3.1 Pro Preview (>200K) $4.00 $18.00 $22.00 Google
Claude Opus 4.7 $5.00 $25.00 $30.00 Anthropic
Claude Opus 4.8 $5.00 $25.00 $30.00 Anthropic
GPT-5.5 $5.00 $30.00 $35.00 OpenAI

性能提升:小幅进步但接近Mythos级能力

在基准测试中,Opus 4.8的表现较前代有所提升而非飞跃:SWE-bench Verified得分88.6%(Opus 4.7为87.6%),更难的SWE-bench Pro得69.2%(4.7为64.3%),Terminal-Bench 2.1得74.6%(4.7为66.1%)。Anthropic将其描述为“对前代的适度但切实的改进”。

该模型在至少12项基准测试中击败GPT-5.5,包括知识工作、编码(问题级)、代理工具使用及长上下文任务。GPT-5.5在终端/CLI工作流中占优,网页浏览和研究生级科学测试中两者持平。

更关键的是,Opus 4.8处于Anthropic内部能力梯队的中游——介于Opus 4.7和性能更强的Claude Mythos Preview之间。后者目前仅限Project Glasswing项目下的少数组织用于网络安全工作,Anthropic表示将在额外网络安全保障就位后“未来几周向所有客户推出Mythos级模型”。

企业合作伙伴已确认显著收益:Databricks称Opus 4.8在其Genie数据代理中“解锁了代理推理的飞跃”,因PDF和图表的多模态效率,令牌成本较4.7降低61%;Hebbia提到引用精度和令牌效率的提升;Devin开发者Cognition指出该模型“直接转化为工程师能力的更快提升”,并修复了4.7的注释冗长和工具调用问题;某计算机使用供应商报告Online-Mind2Web得分84%,超过Opus 4.7和GPT-5.5。

动态工作流:数百个并行子智能体协同处理大型任务

此次发布还推出了Claude Code中的“动态工作流”研究预览,专为单次上下文窗口无法处理的任务设计。该功能中,Claude规划工作、生成数百个并行子智能体,自行验证输出后反馈结果。例如,可完成“数十万行代码的代码库迁移,从启动到合并,以现有测试套件为基准”的任务。

动态工作流已开放给Claude Code的Enterprise、Team及Max计划用户。

此外,本次更新还包括两个小功能:

  • Claude.ai与Claude Cowork中的努力控制:新增选择器让用户调整每次响应的思考量——更高的努力程度意味着更深入的分析。
  • 其他细节优化:未在截断内容中明确,但原文提及“Effort control”为新增功能。

关注微信号:智享开源 ,及时了解更新信息。

原文链接:https://venturebeat.com/technology/anthropics-claude-opus-4-8-is-here-with-3x-cheaper-fast-mode-and-near-mythos-level-alignment

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章1097篇


关注微信

主站最新信息

[blog_mailer_subscribe]

分类