游戏世界训练现实智能，通用 intuition 获23亿投资

Mark Do 暂无评论阅读 82 次

从游戏到现实：AI智能体训练新范式

踏入通用直觉（General Intuition）位于纽约的研发中心，31岁的联合创始人兼首席执行官皮姆·德维特引导我注意到一个站立式办公桌上的显示器。屏幕上仿佛有人在玩类似《堡垒之夜》的游戏，但实际上操控者并非人类。

我们的智能体已经连续游戏100小时了，该公司首席产品官肯特·罗林斯自豪地表示。

游戏中的大脑，现实中的行动

在我沉浸于AI在虚拟环境中导航的景象前，一只四足机器人的电子脚步声已由远及近。这个类似大型昆虫的机器人缓缓向我走来，绕着我转了一圈，继续向办公室深处移动。它偶尔会撞到椅子腿或碰到垃圾桶，就像一个尚未学会身体与周围世界关系的小孩。

操控游戏智能体的同样大脑也在控制这台机器人，德维特解释道。

数据驱动的智能进化

数据分析师乔什·杜普兰蒂斯携带的笔记本电脑上，正实时传输着机器人单目摄像头的画面。他补充说明，机器人的默认模式是”探索”。仅用8分钟的真实世界机器人数据，团队就完成了四足机器人的AI模型微调，且这些数据是在街上采集的，而非机器人当前所在的办公室环境。

能够从游戏泛化到模拟再到实体化的智能体模型，正是通用直觉存在的核心理由。这种模型理解世界的能力已经获得了业界重量级投资者的青睐。

巨额融资与技术突破

近日，通用直觉宣布完成3.2亿美元融资，公司估值达23亿美元，确认了此前的报道。此轮融资使通用直觉的公开融资总额达到4540万美元，其中包括去年10月成立时获得的1340万美元种子轮融资。

这家初创公司脱胎于德维特的另一家Medal公司，该平台允许玩家上传和分享游戏录像。数亿小时的上传游戏录像为通用直觉的模型提供了初始数据集，用于训练时空推理能力——即理解如何在空间和时间中移动。

关键要素：动作标签

但关键并非游戏画面本身，而是嵌入在这些片段中的动作标签：精确记录玩家何时按下了哪些按钮。德维特表示，大多数竞争对手试图仅从视频中推断动作，他认为这种方法是不充分的。

我们将这视为未来预训练的下一个阶段，德维特说道。我们拥有单一模型，既能响应屏幕上的《堡垒之夜》信息并采取行动，又能以LLM（大语言模型）永远无法做到的方式应对现实世界的动态。

世界模型与未来愿景

德维特曾让我体验了一台运行通用直觉世界模型的笔记本电脑，这是一个逐帧生成的模拟环境，而非传统游戏引擎渲染的。当我测试世界模型时，我径直走向一堵堵墙。在其他演示中，你控制的智能体有时会直接穿过障碍物，但这个没有。从数百万小时的游戏体验中，它以某种方式学会了墙是墙，梯子用于攀爬，影子会随着太阳移动而变长。

对通用直觉而言，这个世界模型并非产品，而是训练环境（内部称为”健身房”）。公司最终希望销售智能体模型本身，德维特认为，嵌入在游戏中的动作数据有助于模型区分”自我”与”环境”，从而使其对因果关系有更丰富的理解。

行业前景与投资支持

尽管通用直觉的技术演示令人印象深刻，但并非唯一尝试解决这一问题的公司。此外，让此类模型在物理世界中大规模稳定运行尚未实现。大多数此类方法需要收集大量现实世界数据，过程缓慢且成本高昂。通用直觉的赌注是，游戏是一种可扩展的捷径。

其投资者也认可这一赌注。通用直觉的最新轮融资由Khosla Ventures领投，参与方包括General Catalyst、杰夫·贝佐斯、埃里克·施密特、尼科·罗斯伯格以及Google DeepMind和MIT的研究人员。

本轮融资金额将主要用于扩展计算能力。通用直觉与CoreWeave达成协议，计划专注于预训练下一代模型。部分资金已预留用于在今年夏末前使其API更广泛可用。Khosla表示，他被德维特的愿景和公司的专有数据地位所吸引。

如果你看看LLMs（大语言模型），当推理能力出现时，那是一次量子飞跃。在世界模型中，我认为量子飞跃是AI直觉的出现，一种类似人类直觉的能力。人类的行为数据和反应数据…

关注微信号：智享开源，及时了解更新信息。

0 0

游戏世界训练现实智能，通用 intuition 获23亿投资

从游戏到现实：AI智能体训练新范式

游戏中的大脑，现实中的行动

数据驱动的智能进化

巨额融资与技术突破

关键要素：动作标签

世界模型与未来愿景

行业前景与投资支持

评论列表

发表评论

为你推荐

近期文章

标签

近期评论

分类

热门文章