游戏世界训练现实智能,通用 intuition 获23亿投资

从游戏到现实:AI智能体训练新范式
踏入通用直觉(General Intuition)位于纽约的研发中心,31岁的联合创始人兼首席执行官皮姆·德维特引导我注意到一个站立式办公桌上的显示器。屏幕上仿佛有人在玩类似《堡垒之夜》的游戏,但实际上操控者并非人类。
我们的智能体已经连续游戏100小时了,该公司首席产品官肯特·罗林斯自豪地表示。
游戏中的大脑,现实中的行动
在我沉浸于AI在虚拟环境中导航的景象前,一只四足机器人的电子脚步声已由远及近。这个类似大型昆虫的机器人缓缓向我走来,绕着我转了一圈,继续向办公室深处移动。它偶尔会撞到椅子腿或碰到垃圾桶,就像一个尚未学会身体与周围世界关系的小孩。
操控游戏智能体的同样大脑也在控制这台机器人,德维特解释道。
数据驱动的智能进化
数据分析师乔什·杜普兰蒂斯携带的笔记本电脑上,正实时传输着机器人单目摄像头的画面。他补充说明,机器人的默认模式是”探索”。仅用8分钟的真实世界机器人数据,团队就完成了四足机器人的AI模型微调,且这些数据是在街上采集的,而非机器人当前所在的办公室环境。
能够从游戏泛化到模拟再到实体化的智能体模型,正是通用直觉存在的核心理由。这种模型理解世界的能力已经获得了业界重量级投资者的青睐。
巨额融资与技术突破
近日,通用直觉宣布完成3.2亿美元融资,公司估值达23亿美元,确认了此前的报道。此轮融资使通用直觉的公开融资总额达到4540万美元,其中包括去年10月成立时获得的1340万美元种子轮融资。
这家初创公司脱胎于德维特的另一家Medal公司,该平台允许玩家上传和分享游戏录像。数亿小时的上传游戏录像为通用直觉的模型提供了初始数据集,用于训练时空推理能力——即理解如何在空间和时间中移动。
关键要素:动作标签
但关键并非游戏画面本身,而是嵌入在这些片段中的动作标签:精确记录玩家何时按下了哪些按钮。德维特表示,大多数竞争对手试图仅从视频中推断动作,他认为这种方法是不充分的。
我们将这视为未来预训练的下一个阶段,德维特说道。我们拥有单一模型,既能响应屏幕上的《堡垒之夜》信息并采取行动,又能以LLM(大语言模型)永远无法做到的方式应对现实世界的动态。
世界模型与未来愿景
德维特曾让我体验了一台运行通用直觉世界模型的笔记本电脑,这是一个逐帧生成的模拟环境,而非传统游戏引擎渲染的。当我测试世界模型时,我径直走向一堵堵墙。在其他演示中,你控制的智能体有时会直接穿过障碍物,但这个没有。从数百万小时的游戏体验中,它以某种方式学会了墙是墙,梯子用于攀爬,影子会随着太阳移动而变长。
对通用直觉而言,这个世界模型并非产品,而是训练环境(内部称为”健身房”)。公司最终希望销售智能体模型本身,德维特认为,嵌入在游戏中的动作数据有助于模型区分”自我”与”环境”,从而使其对因果关系有更丰富的理解。
行业前景与投资支持
尽管通用直觉的技术演示令人印象深刻,但并非唯一尝试解决这一问题的公司。此外,让此类模型在物理世界中大规模稳定运行尚未实现。大多数此类方法需要收集大量现实世界数据,过程缓慢且成本高昂。通用直觉的赌注是,游戏是一种可扩展的捷径。
其投资者也认可这一赌注。通用直觉的最新轮融资由Khosla Ventures领投,参与方包括General Catalyst、杰夫·贝佐斯、埃里克·施密特、尼科·罗斯伯格以及Google DeepMind和MIT的研究人员。
本轮融资金额将主要用于扩展计算能力。通用直觉与CoreWeave达成协议,计划专注于预训练下一代模型。部分资金已预留用于在今年夏末前使其API更广泛可用。Khosla表示,他被德维特的愿景和公司的专有数据地位所吸引。
如果你看看LLMs(大语言模型),当推理能力出现时,那是一次量子飞跃。在世界模型中,我认为量子飞跃是AI直觉的出现,一种类似人类直觉的能力。人类的行为数据和反应数据…
关注微信号:智享开源,及时了解更新信息。


关注微信
还没有任何评论,你来说两句吧!