Sakana AI发布Marlin:8小时生成百页深度报告

Sakana AI发布Marlin:8小时生成百页深度报告

东京的人工智能初创公司Sakana AI正式推出了其首款商业化产品——Sakana Marlin。这款产品被定位为“虚拟CSO”(首席战略官),是一款面向B2B领域的自主研究智能体。与追求即时文本生成的现代聊天机器人不同,Marlin专注于深度且长周期的逻辑推理。

Marlin的核心竞争力在于其独特的时间维度运作模式。它不再追求在几秒钟内给出答案,而是能够持续运行自我管理的推理循环,单次运行时长可达8小时。最终,它能交付一份经过深度调研、引用详实的策略报告,篇幅可达100页,并附带高管演示幻灯片。目前,该公司官网已展示了由Marlin生成的样本报告。

该平台现已上线,采用按需付费模式,但严格限制为企业级用途,主要面向企业集团、金融机构及智库。过去两年,生成式AI的炒作主要围绕“速度”,即毫秒级生成诗歌或摘要。然而,企业级应用的前沿正迅速从浅层的快速生成转向深度、严谨的推理。对于大型企业而言,关注点已不再是AI回答得有多快,而是它能思考得有多深。

虚拟CSO:重新定义工作流

部署Sakana Marlin意味着什么?其工作流程与传统大语言模型(LLM)的交互截然不同。用户无需进行繁琐的提示词工程来回沟通,只需提供核心研究主题。在经过简短的初步交流以明确调研范围和方向后,用户即可完全放手。

在随后的数小时内,Marlin将化身为一个独立的数字战略团队。它自主构建初始假设,利用网络收集数据,交叉验证来源以核实发现,并梳理复杂商业环境中的因果动态。这就像是在海量信息中寻找“致胜公式”。不要把它仅仅看作一个搜索引擎,而应将其视为一个被锁在房间里、拥有白板和网络连接的初级战略顾问。早上给出战略提示,下班前,系统就能交付一份全面且专业的方案组合。

Marlin的最终输出并非通用的文本块,而是一套结构化的战略选项,包含高管摘要幻灯片、附录、参考文献及深度研究报告。为了展示Marlin处理复杂综合任务的能力,Sakana列举了多个真实世界的应用案例,包括针对霍尔木兹海峡被封锁场景的详细解决方案推演、全球分散的AI监管格局梳理,以及关于“债券义警”回归等宏观经济趋势的分析。

长周期推理引擎

在底层技术层面,Marlin是Sakana AI过去两年实验室突破性成果的商业化结晶。该产品由一个探索引擎驱动,该引擎基于Sakana此前的技术突破——自适应分支蒙特卡洛树搜索(AB-MCTS),并借鉴了“AI科学家”项目的框架,该项目曾成功实现了从构思到同行评审的科学发现全过程自动化。

为了直观理解其工作机制,可以参考国际象棋引擎的例子:计算机下棋时并非仅凭直觉猜测,而是推演数千种潜在的未来步数,在采取行动前评估每种局面的优劣。Marlin的AB-MCTS引擎在研究中也扮演着类似的角色。

AB-MCTS的技术机制

该技术的起源可追溯至2025年6月,Sakana AI当时发布了相关论文《更宽还是更深?利用自适应分支树搜索扩展LLM推理时算力》。为了鼓励开发者探索集体智能,公司当时以Apache 2.0许可证开源了名为TreeQuest的底层算法库。这一开源里程碑为一年后Marlin这一商业化企业级产品的诞生奠定了基础。

传统上,开发者为了从大模型中提取更高质量的推理,往往依赖“重复采样”这种暴力手段,即并行运行模型数十次并寄希望于其中一个答案正确。然而,重复采样是盲目的,无法评估中间步骤或根据外部反馈进行调整。

AB-MCTS用一种基于贝叶斯决策框架的原则性多轮方法取代了这一范式。在构建战略报告时,系统将研究过程视为可能性的分支树。在树的每个节点,算法根据外部反馈信号动态平衡两种不同的行为:

  • 拓展广度(探索): 当当前路径收益递减或存在未解决的矛盾时,生成全新的替代假设或候选响应。
  • 挖掘深度(利用): 当现有候选方案显示出较高的战略潜力时,对其进行系统性优化、审计和构建。

将这一实验性技术转化为商业引擎的关键在于其扩展为“多LLM AB-MCTS”。Sakana AI的架构为搜索树引入了关键的第三维度:动态选择针对特定子任务调用哪个模型的能力,将行业顶尖的前沿模型视为即插即用的集体智能网络。

根据技术文档,该引擎可以协调高度异构的模型——允许编排模型将初步构思委托给一个LLM,同时利用侧重推理的模型来审计、验证和纠正搜索树早期生成的中间错误。通过在推理时扩展算力——利用多个基础模型在数千次自动化循环中发挥各自独特的“个性”和优势——AB-MCTS为Marlin提供了必要的数学保障。这确保了最终生成的100页战略报告并非冗长的AI生成内容,而是经过系统性、自动化试错验证的高质量产物。

企业级应用与许可

值得注意的是,Sakana Marlin并非面向普通消费者的工具,而是一款限制向公司实体、组织和独资企业提供的商业软件即服务(SaaS)产品。对于企业而言,许可和数据处理条款往往是决定软件采用的关键因素。与许多暗中收集用户输入和专有数据来训练模型的消费级AI工具不同,Marlin在数据隐私和安全性上有着严格的考量。


关注微信号:智享开源 ,及时了解更新信息。

原文链接:https://venturebeat.com/technology/when-deep-research-isnt-enough-for-your-business-sakana-ai-launches-ultra-deep-research-agent-for-100-page-reports-in-8-hours

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章1534篇


关注微信

分类