Sakana发布Fugu多智能体系统,性能超越Claude

昨晚,日益专注于企业市场的AI创业公司Sakana正式发布了Fugu,这是一款多智能体编排系统,通过单一的OpenAI兼容API提供前沿级别的AI性能。
Fugu专为开发者、企业和寻求抵抗供应商锁定和地缘政治出口控制的国家设计,它通过动态将查询路由到可互换的专业AI智能体池,绕过了传统的单体模型结构。
Sakana的首席联合创始人David Ha(前Google Brain成员)在Anthropic于6月12日根据美国政府出口控制命令撤销其最强大模型Claude Mythos 5和Claude Fable 5的公开访问后,将Fugu定位为企业工作流比任何单一AI模型提供商更可靠的选择。正如Ha今日在X帖子中写道:
“Fugu动态协调世界顶级模型来解决复杂任务。我们正在证明,一个精心编排的可互换智能体池能够匹配被限制的前沿模型如Fable和Mythos。
但Fugu的意义不止于性能。我相信编排模型是下一个前沿,超越更大的模型。
依赖单一公司的模型构建国家基础设施是巨大风险。正如最近的出口控制所示,顶级模型的访问权可能在一夜之间消失。
集体智能是应对这种权力集中的实际对冲。Fugu通过依赖完全可互换的智能体池,简单地绕过供应商限制。”
Sakana AI明确表示,Fugu选择的特定模型及其协调方式是专有的,这意味着路由信息被故意对用户隐藏。文档中仅笼统地提到”多样化的强大模型池”、”多个大语言模型”或”专业模型”,未提供具体数量。
通过作为一个复杂的协调者而非独立的基础模型,Fugu在第三方智能体任务的基准测试中匹配了Fable和Mythos等顶级模型的输出质量,同时从根本上改变了开发者部署关键AI基础设施的方式。
Fugu的工作原理及其超越Anthropic的Claude Fable 5之处
从根本上说,Sakana Fugu运作方式类似于总承包商。面对复杂请求时,Fugu不会尝试自己执行每个步骤。
相反,它将问题分解,将子任务委托给专家基础模型池,验证它们的工作,并合成最终输出。
“Fugu本身就是一个大语言模型,经过训练可以调用智能体池中的各种大语言模型,包括递归调用自身实例,”Sakana AI团队在其技术发布中提到。
基于Sakana的两篇2026年研究论文TRINITY和Conductor,该系统使用学习的协调策略而非手动设计的工作流,自主管理模型选择和验证的整个生命周期。对于最终用户,这个多智能体群在标准API端点背后是完全抽象的。
Sakana AI提供系统两种变体以满足不同的工作负载需求:
- Fugu: 高速、低延迟模型,针对日常任务优化。它被设计为交互式聊天机器人的默认引擎,并直接集成到Codex等编码环境中。
- Fugu Ultra: 旗舰版本,专为复杂的高风险任务而设计,如AI研究、网络安全分析和多步骤专利调查。根据Sakana的说法,Fugu Ultra协调更深的专家池,并在严格的科学和推理基准测试中匹配行业领先的单体模型。
此外,在按使用付费计划中,标准Fugu根据激活的特定底层模型收取动态费率,而Fugu Ultra采用固定定价结构,输入每百万代币5美元,输出每百万代币30美元。
根据Sakana分享的基准图表,Fugu在LiveCodeBench上实际上超过了Anthropic的Claude Fable 5的性能,这是一个开源基准,测试在定期更新的软件问题解决任务上的编码性能(Fugu Ultra:93.2,Fugu:92.9,Fable:89.8),并在GPQA-D (Diamond)上击败了先前的Claude Mythos Preview模型,这是生物学、物理学和化学198个研究生级多项选择题的测试(Fugu Ultra:95.5,Fugu:95.5,Mythos Preview:94.6)。
通过协调来自不同提供商的多个模型,Fugu本质上在AI堆栈中构建了原生冗余。如果一个提供商遇到停机或突然的监管限制,Fugu会绕过中断以保持正常运行时间。
许可和可用性
Fugu作为商业专有API服务提供,不是开源框架。
由于Sakana的核心知识产权在于其非明显的协作模式,特定的路由信息——即Fugu为给定查询选择的底层模型确切哪些——仍然是专有的,并故意对用户隐藏。
然而,Sakana为企业数据合规性提供关键控制功能。开发者可以明确将特定模型或提供商从其Fugu路由池中排除,以维持严格的企业隐私标准。
此外,用户可以选择不将其提示用于未来训练数据。从地理位置上看,Fugu在欧盟(EU)和欧洲经济区(EEA)受到限制,同时Sakana正努力使其黑盒数据路由架构符合GDPR法规。
定价相对较高
Fugi在大多数地区立即可用——欧盟和欧洲经济区暂时例外——提供订阅层级和按使用付费定价。
团队可以选择面向个人或直接使用的月度订阅限额:标准层每月20美元适用于轻量级工作流,专业层每月100美元提供10倍标准使用量,高级层每月200美元为连续、长期任务提供20倍使用量。我找不到这些计划中实际包含的代币数量,但我已通过X联系Ha获取更多信息。
作为初始发布的一部分,Sakana为在2026年7月31日前订阅任何层级的用户提供免费第二个月。
对于企业扩展和生产部署,Sakana提供弹性按使用付费计划。对于高风险环境至关重要的是,在此消费型模式下发出的请求优先级高于月度订阅计划的请求。
在此框架下,标准Fugu引擎对查询中涉及的最高层级底层模型收取单一费率,从不叠加多智能体费用。旗舰Fugu Ultra层级(fugu-ultra-20260615)采用每百万代币的固定定价:输入5美元,输出30美元,缓存输入0.5美元。对于使用超过272K代币上下文窗口的极端工作负载,这些费率分别提高到10美元、45美元和1.00美元。与通过提供商API使用单一AI模型相比,这使其成为价格较高的选择之一。
关注微信号:智享开源,及时了解更新信息。

关注微信

还没有任何评论,你来说两句吧!