

往常两年,具身智能赛说念盘考最多的两个方针,一是「寰球模子」,二是「VLA / 动作模子」。
前者以 NVIDIA Cosmos、Google Genie 为代表,看法通过生成式寰球模子延长数据供给;后者以 Physical Intelligence 的 π 系列、Diffusion Policy 等为代表,看法依靠大领域真机数据得回通用动作才智。
两条阶梯各自取得了显贵进展,但谁也莫得真确回答一个问题 —— 当咱们把「物理 AGI」作为目的时,到底需要什么样的算法体系和数据体系,才能跑通 Scaling?
5 月 20 日,武汉光谷。极佳视界(GigaAI)在「家庭场景子品牌发布会暨物理通用智能技艺发布会」上,给出了一份相对圆善的谜底。
九游体育2026世界杯中国官网
极佳视界 5.20 发布会现场
这场发布会公布了五件事:环球首个物理 AGI「双金字塔」体系;家庭场景子品牌「拾光 SeeLight」与首款家庭通用东说念主形机器东说念主「拾光 S1」同步亮相;国内首个着实家庭场景百台部署落地武汉,Q3 起领域化运营;下一代家具「拾光 S2」三季度发布,着实家庭独创版预定通说念即日起开启;终末是一份 12 个月的阶梯图 —— GigaBrain-1、GigaBrain-2、GigaBrain-3 连发三代基础模子,目的是物理 AGI 的「GPT-3 时刻」。
信息量很大,其中咱们最柔顺的,是物理 AGI 的「双金字塔」体系。
从 Scaling 的瓶颈提及
具身智能为什么于今没能跑通 Scaling Law?极佳视界结伙东说念主、研发副总裁叶云在发布会上把问题归结为两条。
第一条在数据侧。真机数据精度最高,却受制于高本钱与小领域;互联网视频领域雄壮,却勤快动作监督信号;仿真数据可无尽延长,却难以高出 sim-to-real gap。任何单一来源,都无法同期骄矜 Scaling Law 所条目的领域、信息密度与着实性。
第二条在算法侧。现时以话语为主导的 VLA 范式,践诺上是把视觉、动作 token 化后送入话语模子,并不擅长编码 3D 信息、物理因果与连气儿动作。换句话说,即便堆够了数据,现在的主流模子架构也有时能高效消化它们。

极佳视界结伙东说念主、研发副总裁 叶云
围绕这两条卡点,极佳视界提倡的措置旅途是把数据和算法分别按档次结构伸开, 一座面向数据的金字塔,一座面向算法的金字塔,二者耦合,统筹兼顾。这即是「双金字塔」体系的来源。

环球首个物理 AGI 「双金字塔」体系
从底层逻辑来看,这是物理 AGI 赛说念第一次有公司把 Scaling 旅途系统化伸开。
五层数据金字塔
数据金字塔从底到顶循序为:互联网视频数据、真东说念主数据、寰球模子模拟器、仿真合成数据、真机数据。
这一分别自己并不令东说念主无意 —— 它基本对应了学术界往常两年对于具身数据来源的主要盘考:真机数据在金字塔尖端,精度最高、笼罩最窄;互联网视频在底部,领域最大、监督最弱;中间三层(真东说念主示范、仿真、寰球模子生成数据)则是最具工程化空间、也最被低估的部分。
真恰恰得驻守的,是极佳视界在每一层都拿出了对应的工程化家具:
真机数据由家庭版轮臂机器东说念主「拾光 S1」和低本钱真机数采硬件「Maker M01」协同鸠合;仿真合成数据与寰球模子模拟器数据由自研具身寰球模子平台「GigaWorld-0」系统化生成;真东说念主数据由低本钱手捏数采硬件「U-01」和低本钱 Ego 数采硬件「E-01」大领域鸠合;互联网视频数据则复用 YouTube、Panda-70M 等公开来源。

极佳视界「数据金字塔」
U-01、E-01 这种「低本钱、非本色绑定」的数据鸠合硬件,同样 Stanford 团队 UMI 与 EgoMimic 的斟酌想路,被学术界公认是冲破真机数据瓶颈的可行方针之一。
区别在于,极佳视界把它和自研机器东说念主本色(S1)、寰球模子平台(GigaWorld-0)一说念作念成了一套圆善的全栈鸠合体系。单点斟酌并不罕有,全栈跑通且每一层都有自研硬件作念支捏,开云体育中国一站式服务官网在国内具身智能公司中现在并未几见。
三层算法金字塔
算法金字塔从底到顶分为:寰球模拟、动作对皆、讲授强化。
极佳视界把这三层分别落到具体的模子上。
寰球模拟层的代表是具身寰球模子 GigaWorld-1。它辞寰球模子领域泰斗评测 WorldArena 上以轮廓得分 62.34 打败 Wan、CogVideoX、Veo 3.1、Cosmos-Predict 等模子得回环球第一,是榜单中首个轮廓得分冲破 60 分大关的具身寰球模子。
动作对皆层包括 GigaBrain-0 系列与 GigaWorld-Policy。前者是 VLA 阶梯的具身基础模子,在环球领域最大的真机评测 RoboChallenge 中以 51.67% 任务告捷率位列环球第一,起首 π0.5 接近 10 个百分点;后者是寰球动作模子,在面向家庭场景的环球泰斗评测平台 RoboCasa365 上打败 NVIDIA GR00T N1.5 与 π0.5 得回环球第一,成为榜单首个登顶的寰球动作模子。
讲授强化层是 GigaBrain-0.5M*,通过「寰球模子 + 强化学习」实现具身基模的自我进化。

极佳视界「算法金字塔」
单一榜单第一在具身智能赛说念并不萧瑟,但同期在「寰球模子 + 师法学习 + 强化学习」三个方进取拿到环球泰斗评测第一,并把三层之间的数据流转接洽买通,现在国内惟一极佳视界一家作念到。WorldArena、RoboChallenge、RoboCasa365 三大泰斗评测遵守分别解释了其在感知 - 生成、真机操作、家庭场景泛化领域的三种中枢才智 。 这三个「环球第一」也有劲解释了「双金字塔」体系背后深厚的技艺支捏。
跑通技艺体系之后,下一站家庭
技艺体系跑通之后,问题酿成 —— 去何处考据 Scaling 是否确凿拓荒。极佳视界给出的谜底是:着实家庭。
发布会上,极佳视界连系独创东说念主、首席科学家朱政博士致密发布公司面向家庭场景的全新子品牌 ——「拾光 SeeLight」,定位「国内首个家庭通用机器东说念主品牌」,由朱政担任品牌 CEO。

极佳视界连系独创东说念主首席科学家、拾光品牌 CEO 朱政
朱政在发布会上暗示:「AGI 不该只停留在屏幕里。咱们不是在讲一个远方的畴昔故事,而是在把骨子里对物理 AGI 的信仰酿成着实的家具,让物理 AGI 劳动每一个东说念主。」
品牌发布同期推出的第一代家具「拾光 S1」,被界说为「环球首个参加着实家庭场景的通用东说念主形机器东说念主」。S1 接纳家庭版轮臂构型,开云世界杯官网(中国)搭载极佳视界自研的具身基础模子,具备从感知、默契到行为的圆善闭环才智。
遴荐家庭、而不是工业线或物流作为物理 AGI 的首发场景,从技艺角度看是一个值得盘考的方案。家庭场景的怒放性、长尾性、东说念主机交互复杂度,都远超工业场景 —— 正因为如斯,它是考据「通用性」最严苛的试金石。极佳视界这种「先难后易」的场景遴荐,与它在算法侧的技艺演进旅途,应该是归并种想路。

视频贯穿:https://mp.weixin.qq.com/s/7UE0h6WvlWgYEHJQjOVivg
百台部署:第一笔可被考据的订单
具身智能赛说念往常一年最被诟病的问题之一,是「发布会演示与着实场景使用之间的边界」 —— 简直通盘公司都会展示样机能作念什么,但鲜有公司能解释它在家里何如用,能用多久。本次发布会上极佳视界给出的修起,是一笔依然落地的订单。
极佳视界告示拾光 S1 已得回着实家庭场景百台订单,将率先部署于武汉光谷之寓社区(位于武汉光谷的着实居住社区),Q3 起开启领域化运营。这是公开信息中领域化家庭通用机器东说念主部署的首例 —— 此前 Figure、1X 等国外厂商天然清晰过家庭试用,但都停留在个位数订单或职工家庭体验。
100 台 + 着实居住社区 + Q3 领域化运营这一组合,意味着一笔穷苦钞票将运转蓄积:着实家庭的弥远使用数据。

机器东说念主参加武汉光谷之寓着实场景
这是 Scaling Law 在物默然能领域真确拓荒的重要。极佳方面在发布会露出:拾光 S1 的家庭场景展示体验空间将于 2026 年 5 月 31 日起怒放参不雅。
拾光 S2:本色侧的系统性重构
发布会还预报了第二代家具「拾光 S2」将于 2026 年三季度致密发布。从清晰的本色参数看,这不是一次小迭代:
底盘体积减少 60%,更恰方丈庭短促空间;电板续航擢升 70%,并支捏热换电,径直决定着实劳动中的连气儿使命才智;操作范围扩大 40%,支捏 2.2 米高度内任求实行。朱政在发布会上暗示:「S2 的中枢,不是某个参数变得更漂亮,而是整机运转更接近着实家庭所需要的『可用性』。」

拾光 S2 全新经营构型,订价、发售战略将于三季度全面揭晓
从产业视角,机器东说念主本色侧的重要瓶颈其实是「能弗成在着实家庭里弥远清爽使命」—— 续航、热照看、要津寿命、安全冗余、爱戴本钱。S2 的三项升级都径直对应这条线,工程取向相对克制。同期,着实家庭独创版预定通说念,自即日起致密开启。
12 个月,三代基础模子
剑指「GPT-3 时刻」
发布会的终末一个部分,是极佳视界初度公布物理 AGI 基础模子的 12 个月阶梯图 —— GigaBrain-1、GigaBrain-2、GigaBrain-3 连发三代。
GigaBrain-1 将于 2026 年第三季度发布,是环球首个基于「双金字塔」体系打造的物理 AGI 基础模子,目的是在物默然能泛化性上达到新高度。后来 GigaBrain-2 与 GigaBrain-3 加快 Scaling,其中 GigaBrain-3 将基于 1000 万小时视频数据 + 100 万小时寰球 - 动作数据进行老师,剑指物理 AGI 的「GPT-3 时刻」。

GigaBrain-3 剑指物理 AGI 的「GPT-3 时刻」
GPT-3 在数字 AGI 历史上的真义,不在模子自己,而在「初度让 Scaling Law 显现涌现才智」的阿谁临界点 —— 当模子领域与数据领域到达某个阈值后,才智从量变跃迁为质变。物理 AGI 的「GPT-3 时刻」在表面上应该是同构的:数据领域(1000W + 100W 小时)和算法范式(双金字塔)到达某个临界点后,物默然能体阐扬出真确真义上的通用性。
这是一个可被磨真金不怕火的假定。畴昔 12 个月后,行业就会看到这个临界点是否确凿存在、极佳视界给出的具体数字是否落在临界点之上。在具身智能赛说念现时阶段,这种「用明确技艺节点修起根底问题」的姿态并不常见 —— 同业的回答大多停留在「行将」、「快了」、「五年内」这一类时候拖沓化的表态。
极佳视界把「物理 AGI 何时到来」拆解为「需要什么样的体系」 + 「什么时候到达」两个具体的技艺命题,这是这场发布会真确区别于其他同类发布的地点。
三件事值得链接跟踪
一场发布会,把往常三年的技艺蓄积、当下的家具竣事、畴昔 12 个月的技艺阶梯图,一次性铺开。
从技艺圈的角度,接下来有三件事最值得跟踪:
第一,「双金字塔」体系是否确凿能跑通 Scaling Law —— 五层数据 + 三层算法的耦合接洽是否拓荒,将由 GigaBrain-1(Q3 发布)与 GigaBrain-3(GPT-3 时刻)两次考据。
第二,百台家庭部署是否确凿产生灵验的数据闭环 —— 着实家庭弥远使用数据是物默然能领域现在最稀缺的钞票,若是闭环跑通,极佳视界在数据侧的护城河会随时候快速变深。
第三,GPT-3 时刻是否确凿会在 12 个月内到来 —— 这是物理 AGI 赛说念现时最具争议、也最有竣事价值的判断。
往常半年,对于「物理 AGI 何时到来」的盘考已成为行业高频话题,英伟达、Figure、Physical Intelligence、星河通用、智元…… 每一家都给出过我方的回答。但放置现在,莫得任何一家公司像极佳视界这么,把这个问题拆解为「算法 + 数据体系」和时候表。
系统性门径论 + 可考据时候表的组合开云2026世界杯中国官网,这是此次发布会真确区别于其他同类发布的地点。