• 首页
  • 开云体育
  • 关于开云
  • 开云新闻
  • 开云盘口
  • 2026世界杯
  • 开云体育app
  • 你的位置:开云体育(中国)官方网站 > 关于开云 > 开云体育(中国)官方网站 杨立昆发布史上最“轻”天下模子, 单GPU可训, 打算速率擢升48倍

    开云体育(中国)官方网站 杨立昆发布史上最“轻”天下模子, 单GPU可训, 打算速率擢升48倍

    发布日期:2026-03-30 20:48    点击次数:166

    开云体育(中国)官方网站 杨立昆发布史上最“轻”天下模子, 单GPU可训, 打算速率擢升48倍

    在通往通用智能(AGI)的谈路上,天下模子(World Model)正被视为最关键的下一步。

    宽泛来说,天下模子就像是给 AI 装上了一个“大脑模拟器”。它让机器东谈主不再只是是机械地扩充教唆,而是具备了在念念象空间中预演异日的能力。当一个机械臂试图执取杯子时,天下模子允许它在真实出手前,先在脑海中模拟不同动作可能导致的扫尾。

    为了构建这种模子,图灵奖得主杨立昆忽视了纠合镶嵌瞻望架构(JEPA)。该圭臬不径直让 AI 瞻望复杂的画面变化,而是先把画面“压缩”成一串浅薄的中枢特征,再让 AI 学怎样瞻望这些中枢特征的变化。这么一来,AI 无用关怀画面的细枝小节,只执关键面孔,服从会高好多。

    有关词,传统 JEPA 技艺打造的 “模拟器”,长久存在核肉痛点,成为其落地行使的停止。

    其一,磨练易 “暗示崩溃”,稳重性差。为了温顺完成特征瞻望任务,AI 会出现“偷懒”行径:将扫数不同的视觉输入映射为险些疏浚的潜特征,看似瞻望精确,实则这些特征毫无现实价值,这一问题被称为“暗示崩溃”;其二,超参数繁琐,调参资本极高。主流端到端 JEPA 圭臬如 PLDM 领有 6 个可调超参数,参数的轻细变化齐会导致模子性能天壤之隔,调参不仅需要多数的时辰和运筹帷幄资源,且参数无法跨任务复用,换一个任务就需要重新调试,门槛极高。

    其三,运筹帷幄资本高,打算运转冉冉。部分圭臬为幸免“暗示崩溃”,会依赖提前磨练好的超大视觉预磨练模子行动基础,虽能擢升稳重性,却让模子体积肥壮、编码服从低下,AI 完成一次决议打算需要消耗多数时辰。

    近日,杨立昆团队发表的论文,忽视了一款名为 LeWorldModel(简称 LeWM)的全新天下模子,中枢不停了传统 JEPA 磨练不稳重、易崩溃、超参数多、运筹帷幄资本高的问题,是首个能从原始像素数据端到端稳重磨练的天下模子。总共模子就 2 个中枢组件、2 个归天项,15M 参数,单 GPU 几小时就能训完,惟有 1 个有用可调超参数。

    LeWM 的构成极度精简,包括两部分。一个是编码器,用轻量的视觉模子,把录像头拍的彩色画面,酿成一串随意的中枢特征,收拢画面里的关键信息;另一个是瞻望器,把柄 “现时的中枢特征以及要作念的动作”,精确瞻望下一步的中枢特征,比如 “推一下方块,它的位置特征会酿成什么样”,学懂环境的运转面孔。

    LeWM 最中枢的突破,在于用两个浅薄且有科学复旧的磨练筹商,从根底上不停了传统 JEPA 的“暗示崩溃”问题,澈底遗弃了劝诫性妙技。其一为瞻望归天,是让 AI 精确瞻望异日的中枢特征,保证学的面孔有用;其二是 SIGReg 正则化,逼着 AI 把中枢特征散播得均匀万般,开云体育(中国)官方网站不让它把扫数画面齐映射成雷同的特征。

    同期,LeWM 把调参的难度降到了最低,以前要调 6 个参数,当今只需要调 1 个,而况调参的圭臬极度浅薄,无用反复试错,普通东谈主也能上手。

    在现实性能测试中,护士团队在二维导航、机械臂适度、推方块等经典连气儿适度任务上测试了 LeWM,并与现时主流的 JEPA 圭臬(DINO-WM、PLDM)、行径克隆(GCBC)、离线强化学习(GCIVL、GCIQL)等圭臬张开对比。

    在二维导航任务中,智能体需要从一个房间穿过独一的门,导航至另一个房间的指定筹商位置,熟练 AI 的旅途打算和环境感知能力。LeWM 在该任务中虽略逊于传统圭臬,但其潜特征仍能精确捕捉智能体的位置信息,后续护士说明,这一进展各异并非源于特征学习不及,而是浅薄环境的内在维度与 SIGReg 的正则化条款存在适配性问题,并非模子自己的性能弱势。

    图 | LeWM 在不同任务测试中的进展(起首:上述论文)

    在推方块任务中,LeWM 终明晰性能突破,得胜率比主流端到端圭臬 PLDM 朝上 18%,更关键的是,仅依靠纯像素输入的 LeWM,性能竟越过了额交代融机器东谈主骨子感受信息(枢纽情景、畅通数据)的 DINO-WM,充分诠释注解其能从纯视觉画面中,精确捕捉到任务所需的总共关键面孔,无需特地信息扶植。

    除此以外,LeWM 的打算服从更是终明晰质的飞跃。因为模子轻、特征浅薄,LeWM 作念决议打算的速率,最高是传统大模子圭臬的 48 倍,单次打算不到 1 秒,不同任务、不同环境下速率齐很稳重。

    同期,LeWM 的磨练稳重性远超传统圭臬:传统 PLDM 的磨练弧线波动剧烈,像“坐过山车”,而 LeWM 的磨练弧线平滑单调拘谨,瞻望归天稳步下落,SIGReg 归天在磨练初期快速下逾期趋于牢固,且不同立地种子下的磨练扫尾方差极小,可复现性大幅擢升,澈底不停了传统圭臬“一次得胜、次次翻车”的问题。

    图 | LeWM 磨练旅途(起首:上述论文)

    最强横的是,LeWM 造的 “模拟器”,不是单纯靠死记硬背数据,而是真的学懂了物理天下的面孔。

    实验中,护士东谈主员能从 LeWM 的中枢特征里,精确索要出物体位置、角度、速率这些物理量,精度比传统圭臬高好多;更兴味的是,给 LeWM 看三种视频:物体正常畅通、物体情态一忽儿变了、物体一忽儿瞬移(违背物理面孔),LeWM 对瞬移会进展出彰着的诧异(瞻望畸形骤增),对情态变化却险些没响应。这诠释它能分清“只是外不雅变了”和“物理面孔被冲突了”,真实明白了天下的运转逻辑,而不是只难忘画面的名义特征。

    虽然,面前 LeWM 还有一些小短板:比如当今只可作念短期的决议打算,打算太久会积聚畸形;在极度浅薄的环境里,部分磨练章程的成果会打扣头;磨练时还需要明确的“动作标签”,比如“推方块”要标注出推的见解和力度。

    针对这些问题,护士团队也指出了异日的窜改见解,比如把长任务拆成短任求终了历久打算、让模子从海量当然视频里学通用物理面孔、让模子我方从画面里学动作,无用特地标注。

    参考畅通:

    运营/排版:何晨龙开云体育(中国)官方网站

    豪门国际官网娱乐网