当OpenAI的奥特曼还在到处买显卡、买算力,来支撑他的Sora 2视频生成模型。李飞飞的实验室The World Labs,用一张显卡就能运行一个世界。他们今天发布了一项名为RTFM(Real-Time Frame Model)的新技术,一个全新的实时世界生成模型。和九月中旬发布的图生世界Marble不同,RTFM不仅是用一张照片,生成一个我们可以自由漫步、探索的3D世界。最重要的是,它被设计为可以在单块H100 GPU上高效运行,并且实时生成。目前,RTFM已经作为研究预览版正式发布,并提供了Demo可以亲自去试试。RTFM Demo链接:https://rtfm.worldlabs.ai/意外地发现,这个Demo的名字叫做FRAMEBOY,结合这个网页布局,我很快想到了年代久远的Game Boy游戏机。这样一个拥有逼真的光影、反射和阴影的世界,并且这一切还在我们眼前实时发生,在某种程度上,何尝不是另一种玩游戏。不止于生成,更在于实时互动RTFM的核心能力,就是能实时生成可供用户交互的视频。它可以从一张静态图片开始,实时渲染出一个可以自由探索的3D场景。与许多世界模型不同,RTFM能够学习并渲染出极其复杂和真实的视觉效果。无论是光滑大理石地面的倒影、物体在阳光下的阴影,还是透过玻璃看到的景象,RTFM都能准确地模拟。RTFM依靠的不是传统的图形学编程,而是让模型通过对海量视频数据的端到端学习,不断进化出来的。支撑这项能力的,是设计RTFM背后围绕的三项核心原则。效率(Efficiency),要想把未来拉到眼前,世界模型的计算需求是最大的阻碍。无论是像Sora这样的AI生成视频,还是Google尚未正式公开上线的Genie 3,都意味着巨大的计算挑战。有相关的研究提到,要实时生成4K 60fps的交互视频流,AI模型每秒需要处理的tokens数量约等于一本《哈利·波特》的文字量。而如果要在超过一小时的交互中,保持这些生成内容的持续性,需要处理的上下文,将超过100M个token。这对于当下的计算基础设施而言,既不现实,也难以负担。李飞飞团队的目标是“在今天的硬件上,运行明天的模型,并提供最高保真度的预览。”他们通过对架构、模型蒸馏和推理过程的极致优化,以及整个系统的重新设计。RTFM成功地实现了,仅使用单个H100 GPU,就可以交互式帧率进行推理,实时生成。可扩展性(Scalability),从视频模型,能直接到世界模型。传统的3D引擎,用的是三角网格、高斯点云、体素渲染等显式结构,完全依赖于一些复杂的计算机图形学知识。每个物体都要建模、上材质、打光、烘焙阴影。这和我们之前介绍的混元3D世界,所采用的方法类似,它们主打的是实现3D全管道的生成。传统 3D 方式(左)和 RTFM 方式(右)World Lab选择的路和混元不同,RTFM不会构建任何显式的3D模型。它使用了类似Sora的“自回归扩散Transformer”,直接从视频帧序列中学习世界规律。举个例子,模型不再需要知道“这是一堵墙”或“那是一盏灯”,它只通过成千上万段视频的学习,学会了什么是“空间感”,学会从输入的2D图像序列中,预测出下一个新的视角画面。和生成3D资产的路线不同,RTFM能够更好地利用不断增长的数据和算力,从而实现无限扩展。持久性(Persistence),让世界模型像nano banana一样保持一致。大部分的视频生成模型有一个天生缺陷,就是它们没有记忆。即便现在Sora一次性能生成25秒的震撼画面,但视频生成结束后,世界就结束了,并不能提供持续的交互。而如果要记住所有场景,计算负担势必又会随着探索的深入而无限累积。RTFM试图解决的,就是让生成的世界具备持续存在的能力。它引入了一个叫“spatial memory(空间记忆)”的机制。它为生成的每一帧画面,都赋予了在3D空间中的精确“姿态”(位置和方向)。在生成新画面时,模型会采用一种“上下文杂耍”(context juggling)的技术,只调用新画面附近位置的帧作为参考,而不是全局内容。这使得RTFM能够做到,让我们反复进入这个世界,离开再回来,而不会增加计算负担。目前,RTFM的Demo体验时间只有3分钟,3分钟后,它还是会不记得这个世界。我在那个Demo里面拖动左右两个摇杆,玩了很久,想到了李飞飞之前说,空间智能才应该是AGI的下一个方向。未来是否真的有机会,像头号玩家一样,让现实世界和虚拟世界之间,产生明确的联系,光看现在的世界模型,要加载的内容还有太多。毕竟,即便单个H100 GPU,售价也大约在25000美元以上。但是当算力的价格下降,当算法再快一点;我们或许能看到,真正意义上的世界模型“大更新”,是现实,被完整生成的那一天。本文来自:APPSO (ID:appsolution)
- 和AI这道正餐相比前几十年的科技总和只是前菜
- 起底全球估值NO1机器人公司创始人被称作下一个马斯克
- 70名员工估值70亿
- 英特尔还不能急着开心
- 英伟达50亿美元战投英特尔芯片双英历史性牵手
- OpenAI想杀入苹果腹地
- 当AI开始闹情绪打工人反向共情
- 微软Windows再次被指暗藏后门区别对待中国用户
- OpenAI首批智能硬件传出新消息
- AI短视频正在打败人类主播
- 对话董本洪企业AI依然存在认知偏差
- Figure向真实世界挤了挤
- 从看图识鸟到生态建模的硬科学
- 英特尔联姻英伟达是自救还是颠覆
- 即将到来的智能战争不可避免的未来
- 黄仁勋50亿美元入股英特尔英伟达一统GPUx86生态
- 芯片圈最离谱的CP即将改写行业规则
- 把上万个AI丢在一个小镇里打工会发生什么
- 官宣特斯拉OptimusAI团队负责人离职
- 2025年2nm芯片为何集体跳票
- 朱啸虎搬离中国假装不是中国AI创业公司是没有用的
- 宝可梦游戏成了AI的最佳训练场
- 让出门问问盈利的一场内部革命裁员降薪取消中层
- AI正在建立自己的经济体人类准备好被降维打击了吗
- 微软广告终于找到了接盘侠
- AI叙事逐渐离谱
- 一颗18纳米芯片成了英特尔最后的救赎
- 泰勒斯威夫特再次陷入AI风波但这次粉丝倒戈了
- 姚顺宇离职背后国产大模型已经上桌了
- 智能体崛起
- 史上最强打工人老板布置的杂活被他干成了诺贝尔奖
- DeepSeek等开源模型更浪费token吗
- 2025年诺贝尔物理学奖发得合理吗
- 番茄小说的AI难题
- 固态电池再受吹捧这次不是狼来了
- 投资马斯克20亿英伟达构建AI资本帝国只用了一个月
- 当AI开始设计芯片
- 别整天喊科学没突破了今年诺奖全是高手
- Arduino被收购天堂还是地狱
- ChatGPT做电商了
- 日入2千的飞手为何集体逃离
- 湿件登场生物混合机器人开辟第二赛道
- 20个30岁以下敢把世界掀翻的疯子正在集结
- 华人AI大神霸气离职一篇博客挑明中美大模型暗战
- 当AI恐慌席卷硅谷这位管理2000人的CEO却说AI不会抢你的工作
- 最后的学术净土也脏了顶尖数学家虚假论文数量正在惊人增长
- 30年前被评审嫌弃无用的材料为何能赢得诺贝尔化学奖
- 智元原力无限双双拿下亿元大单具身智能落地时刻到了
- 把12个AI凑到一起打工它们竟然搞起小团体
- 杨振宁的32项科学贡献
- 海内外众学者发声痛别杨振宁他仍在塑造物理的未来
- 李飞飞世界模型大更新实时生成3D世界只要一块GPU
- 新凯来的高端示波器是什么水平
- 电磁弹射技术如何让航母战力惊人飞跃
- 300多个APP想让我和AI谈感情
- 黄仁勋英伟达在中国的市场份额从95变成了0
- 一枚戒指估值777亿
- 张鹏对谈朱啸虎储瑞松傅盛AgenticAI时代不要什么东西都自己闷头做
- 霸气台积电才是AI时代最强王者
- 哈佛新研究追踪6200万人AI冲击下这些985211反而比二本更难找工作
- 如果我死了请不要用Sora复活我
- 着急上市的智谱和六小龙得证明自己能赚钱
- 被困住的日本数据中心在AI梦电老虎与扰民噩梦中挣扎
- 英伟达Blackwell芯片在美量产下线
- 阿里字节腾讯集体重仓新风口
- 阿布扎比重投AI
- 你骂AI越狠它反而越聪明
- ChatGPT欧洲付费用户增长停滞
- 杨振宁走了物理学的黄金时代落幕了
- 吉利战略收缩李书福的儿子也不能例外
- 仅需一块GPU李飞飞最新世界模型来了
- AI应用概念龙头回来了
- 5位专家用10案例讲清工业大模型落地难点
- 在中国哪家互联网平台真把社会责任当回事
- 这只年底睁开的超级眼睛为何是我国科技自立自强的利器
- 世界进入新瓦特时代
- AI交易大赛结果出炉只有中国AI赚钱跟GPT5反着买别墅靠大海
- 氮化镓GaN要变天了
- 中国AI赢下第一场金融实测
- AI漫剧比短剧更短剧
- 存储系统如何用好SSD
- 小鹏机器人里面是不是真人全球网友吵翻了CEO现场扒开衣服自证
- 中国最活跃AI基金的闭门会上10条关键思考
- 马斯克万亿薪酬包特斯拉股东批准了
- 逆袭的中国铁锂从过剩产能到反制西方的战略核弹
- 我把DeepSeek装进毛绒玩具年入过亿
- 人形机器人逼近产业化关口谁在买
- 一篇文章告诉你国产GPU背后的技术和商业路线异同
- 没人想成为北宇树了
- 4个金融男搞音乐1年赚超1亿美元
- 对话马修科布AI不具备创造性我们为什么会信任机器
- 打破信息茧房可能是个伪命题
- 地球快养不起AI了上太空后又便宜了马斯克
- 从智能客服到数字伙伴小赢科技用户体验全面升级
- 全球半导体产业陷入材料资源困局
- OpenAI和微软的关系没那么糟跟英伟达也没那么好
- 人工智能被频繁写进裁员理由AI真的在大规模取代人类工作吗
- 黄瑜人工智能对脑力劳动的取代已迅速铺开2025年终特辑14
- AI玩具赛道打响发令枪
- 有消息称月之暗面将借壳上市知情人士予以否认
- 罗振宇2026时间的朋友跨年演讲全文稿
- 一年从0到300万美元ARR非典型AI创业者斩获千万融资
- 围裙AI与万元学费2025教育的冰与火I年度盘点
- 不再造硬件的罗永浩办了一场硬件发布会
- 迈向无限企业AI智能体打开创新想象新边界
- 从明天起关心粮食蔬菜算法和老己
- 罗永浩为什么要吃力不讨好的搞这场科技春晚
- 你好2026青年站在这里
- 在滴水湖畔我们把宇宙搬到了路边
- CityReadsin11YearsAnotherBeadontheString
- Kimi账上100亿杨植麟我们不着急上市
- OpenAI人均股权薪酬超千万
- 这个真相有点颠覆为什么假装成功比努力成功更容易
- ClaudeCodeCursor都过时了硅谷顶流大牛炸场暴论AI编程练满2000小时才算会用荒废一年世界级大神也成实习生水平
- 谷歌三年逆袭草蛇灰线伏脉千里
- 2025年最挣钱的副业是养一只机器人
- 华人掌舵MetaAI的格局已经初步形成了
- 中国人的精神状态藏在这10个隐形冠军背后
- 胡翌霖大问题在当下重新变得充满争议2025年终特辑09
- CES2026的科技年会上我们要赌一个怎样的未来