开云体育(中国)官方网站杨立昆发布史上最“轻”天下模子, 单GPU可训, 打算速率擢升48倍

开云体育(中国)官方网站

开云体育> 关于开云> 开云新闻> 开云盘口> 2026世界杯> 开云体育app>

你的位置：开云体育(中国)官方网站 > 关于开云 > 开云体育(中国)官方网站杨立昆发布史上最“轻”天下模子, 单GPU可训, 打算速率擢升48倍

发布日期：2026-03-30 20:48 点击次数：166

开云体育(中国)官方网站杨立昆发布史上最“轻”天下模子，单GPU可训，打算速率擢升48倍

在通往通用智能（AGI）的谈路上，天下模子（World Model）正被视为最关键的下一步。

宽泛来说，天下模子就像是给 AI 装上了一个“大脑模拟器”。它让机器东谈主不再只是是机械地扩充教唆，而是具备了在念念象空间中预演异日的能力。当一个机械臂试图执取杯子时，天下模子允许它在真实出手前，先在脑海中模拟不同动作可能导致的扫尾。

为了构建这种模子，图灵奖得主杨立昆忽视了纠合镶嵌瞻望架构（JEPA）。该圭臬不径直让 AI 瞻望复杂的画面变化，而是先把画面“压缩”成一串浅薄的中枢特征，再让 AI 学怎样瞻望这些中枢特征的变化。这么一来，AI 无用关怀画面的细枝小节，只执关键面孔，服从会高好多。

有关词，传统 JEPA 技艺打造的 “模拟器”，长久存在核肉痛点，成为其落地行使的停止。

其一，磨练易 “暗示崩溃”，稳重性差。为了温顺完成特征瞻望任务，AI 会出现“偷懒”行径：将扫数不同的视觉输入映射为险些疏浚的潜特征，看似瞻望精确，实则这些特征毫无现实价值，这一问题被称为“暗示崩溃”；其二，超参数繁琐，调参资本极高。主流端到端 JEPA 圭臬如 PLDM 领有 6 个可调超参数，参数的轻细变化齐会导致模子性能天壤之隔，调参不仅需要多数的时辰和运筹帷幄资源，且参数无法跨任务复用，换一个任务就需要重新调试，门槛极高。

其三，运筹帷幄资本高，打算运转冉冉。部分圭臬为幸免“暗示崩溃”，会依赖提前磨练好的超大视觉预磨练模子行动基础，虽能擢升稳重性，却让模子体积肥壮、编码服从低下，AI 完成一次决议打算需要消耗多数时辰。

近日，杨立昆团队发表的论文，忽视了一款名为 LeWorldModel（简称 LeWM）的全新天下模子，中枢不停了传统 JEPA 磨练不稳重、易崩溃、超参数多、运筹帷幄资本高的问题，是首个能从原始像素数据端到端稳重磨练的天下模子。总共模子就 2 个中枢组件、2 个归天项，15M 参数，单 GPU 几小时就能训完，惟有 1 个有用可调超参数。

LeWM 的构成极度精简，包括两部分。一个是编码器，用轻量的视觉模子，把录像头拍的彩色画面，酿成一串随意的中枢特征，收拢画面里的关键信息；另一个是瞻望器，把柄 “现时的中枢特征以及要作念的动作”，精确瞻望下一步的中枢特征，比如 “推一下方块，它的位置特征会酿成什么样”，学懂环境的运转面孔。

LeWM 最中枢的突破，在于用两个浅薄且有科学复旧的磨练筹商，从根底上不停了传统 JEPA 的“暗示崩溃”问题，澈底遗弃了劝诫性妙技。其一为瞻望归天，是让 AI 精确瞻望异日的中枢特征，保证学的面孔有用；其二是 SIGReg 正则化，逼着 AI 把中枢特征散播得均匀万般，开云体育(中国)官方网站不让它把扫数画面齐映射成雷同的特征。

同期，LeWM 把调参的难度降到了最低，以前要调 6 个参数，当今只需要调 1 个，而况调参的圭臬极度浅薄，无用反复试错，普通东谈主也能上手。

在现实性能测试中，护士团队在二维导航、机械臂适度、推方块等经典连气儿适度任务上测试了 LeWM，并与现时主流的 JEPA 圭臬（DINO-WM、PLDM）、行径克隆（GCBC）、离线强化学习（GCIVL、GCIQL）等圭臬张开对比。

在二维导航任务中，智能体需要从一个房间穿过独一的门，导航至另一个房间的指定筹商位置，熟练 AI 的旅途打算和环境感知能力。LeWM 在该任务中虽略逊于传统圭臬，但其潜特征仍能精确捕捉智能体的位置信息，后续护士说明，这一进展各异并非源于特征学习不及，而是浅薄环境的内在维度与 SIGReg 的正则化条款存在适配性问题，并非模子自己的性能弱势。

图 | LeWM 在不同任务测试中的进展（起首：上述论文）

在推方块任务中，LeWM 终明晰性能突破，得胜率比主流端到端圭臬 PLDM 朝上 18%，更关键的是，仅依靠纯像素输入的 LeWM，性能竟越过了额交代融机器东谈主骨子感受信息（枢纽情景、畅通数据）的 DINO-WM，充分诠释注解其能从纯视觉画面中，精确捕捉到任务所需的总共关键面孔，无需特地信息扶植。

除此以外，LeWM 的打算服从更是终明晰质的飞跃。因为模子轻、特征浅薄，LeWM 作念决议打算的速率，最高是传统大模子圭臬的 48 倍，单次打算不到 1 秒，不同任务、不同环境下速率齐很稳重。

同期，LeWM 的磨练稳重性远超传统圭臬：传统 PLDM 的磨练弧线波动剧烈，像“坐过山车”，而 LeWM 的磨练弧线平滑单调拘谨，瞻望归天稳步下落，SIGReg 归天在磨练初期快速下逾期趋于牢固，且不同立地种子下的磨练扫尾方差极小，可复现性大幅擢升，澈底不停了传统圭臬“一次得胜、次次翻车”的问题。

图 | LeWM 磨练旅途（起首：上述论文）

最强横的是，LeWM 造的 “模拟器”，不是单纯靠死记硬背数据，而是真的学懂了物理天下的面孔。

实验中，护士东谈主员能从 LeWM 的中枢特征里，精确索要出物体位置、角度、速率这些物理量，精度比传统圭臬高好多；更兴味的是，给 LeWM 看三种视频：物体正常畅通、物体情态一忽儿变了、物体一忽儿瞬移（违背物理面孔），LeWM 对瞬移会进展出彰着的诧异（瞻望畸形骤增），对情态变化却险些没响应。这诠释它能分清“只是外不雅变了”和“物理面孔被冲突了”，真实明白了天下的运转逻辑，而不是只难忘画面的名义特征。

虽然，面前 LeWM 还有一些小短板：比如当今只可作念短期的决议打算，打算太久会积聚畸形；在极度浅薄的环境里，部分磨练章程的成果会打扣头；磨练时还需要明确的“动作标签”，比如“推方块”要标注出推的见解和力度。

针对这些问题，护士团队也指出了异日的窜改见解，比如把长任务拆成短任求终了历久打算、让模子从海量当然视频里学通用物理面孔、让模子我方从画面里学动作，无用特地标注。

参考畅通：

运营/排版：何晨龙开云体育(中国)官方网站

豪门国际官网娱乐网