
作者:陈佳惠
“大家估值都在蹭蹭往上走,我们要成为巨头就得万亿市值。”
2025年11月,星动纪元完成10亿元融资后,创始人、CEO陈建宇表示。
接下来三个多月,具身智能行业20多家公司融资超过200亿元。星动纪元又完成一轮10亿元的新融资,三星和高成投资领投,估值突破100亿元。
“融资不只是融钱,也是融资源。”
陈建宇说,现在许多机构意识到具身值得投入,积极融资能把好的战略合作伙伴绑定在同一个阵营里,扩大竞争优势。
出生于1992年,陈建宇19岁考上清华大学,毕业设计研究 “双足机器人步态规划”;在加州大学伯克利分校读博时,他重点研究如何把强化学习融入到机器人控制中,期间还去无人驾驶公司Waymo和Nutonomy实习过。
陈建宇
2020年毕业后,陈建宇回到清华大学,担任交叉信息研究院助理教授,机器人是主要的研究方向。
28岁,大多数博士刚毕业的年纪,陈建宇成为博士生导师。2023年,他创办星动纪元。
“陈(助理)教授比较务实。” 一位投资人说,这是他投资星动纪元的原因之一。
2025年7月,陈建宇给团队找新办公室时,挑了一家在线教育公司的办公室,“装修看起来还不错,办公桌椅能继续用,能省下一笔费用”。
陈建宇如今每天骑电动车上班,住的房子也不够人形机器人施展。
经营一家具身智能公司,陈建宇足够大气。他选择研究有灵巧手、双腿的全尺寸人形机器人;既追求机器人的运动控制能力,又投入资源研发具身智能模型。
模型层面,他们同时研究 VLA 和世界模型结合的不同分支,“单靠一套技术能做的事比较有限”。
整个行业只有市值1.5万亿美元的特斯拉、融资近20亿美元的Figure,和两年融资10轮的智元机器人这样做。
陈建宇认为,这就是最大的务实,“先把最难、适配范围最广的部分做了,商业化的可能性就多了。”
他分享了自己关于具身智能模型路线、商业化的理解,以及他看到的行业的下一个赛点。
1
聚拢资源
记者:星动纪元两轮融资都拿了10亿元,中间只隔了3个月。为什么这么积极融资?
陈建宇:融资融的不只是钱,也是融资源。很好的战略合作伙伴,可以通过融资绑定到一个阵营里,未来我们竞争会拥有更好的生态位。
比如我们的领投方三星,也是我们客户,当时他们是中国投一家,美国投一家,韩国投一家。
2024年开始,大家就在想这个行业会不会往下砸,后面(融资)越来越夸张。回望之前,大家没有投进蔚小理时也后悔,之前觉得估值太高了,但现在来看,估值完全不高。芯片、大模型行业一样。
互联网这些行业会有泡沫破灭的风险,因为如果发现是伪需求,行业就不存在了。
硬科技不是这样,需求是真实存在的,它背后是生产力提升。大家对技术发展速度预判过高或过低,会有一些波动。长期来看,它(的趋势)肯定是稳步地上升。
记者:这两轮的投资方里,有多少机构是第一次投具身?
陈建宇:还是有不少。很多老股东也想跟投,但我们没有额度了。比如我们这次另一个联合领投方高成资本,就是第一次投。也有很多二级机构的人来问我,能不能把二级的钱现在就投到公司里。(笑)
记者:春节之后,至少有五家具身公司宣布完成了超十亿的融资。大家拿这么多钱,争的是什么?
陈建宇:大家其实是在赛跑。赛跑我们的技术,赛跑商业化的速度。终点都是商业化的成功,谁能先把这个真正高价值的、具备规模化能力的产品给做出来。
记者:融了这么多钱,打算怎么花出去?
陈建宇:具身智能链条比较长,花钱的地方不少。
比如硬件生产、制造,模型的训练、数据收集,都是大头。到后面商业化,机器人是实物,中间的渠道、销售等,也要花钱。
现在模型还没有到规模特别大,商业化也还没大规模铺开,花钱相对少一些。当它规模化时,消耗资金速度会加快,现在融资也是提前为以后做好准备。
记者:两轮融资之间,能看到具身智能行业发生什么实质变化吗?
陈建宇:行业越来越重视技术的最终落地了。机器人上春晚,首先增强的是信心,观众们看机器人跳舞会发现,机器人一年的时间进展可以这么快。
现在来看,跳舞也是一种商业模式。但行业变化非常快,具身公司一定要找到第二增长曲线,一定在工业类、生产类的场景里面。今年和明年很关键,机器人要从跳舞走向干活,真正意义上去干活,而不是秀个Demo。
另外是模型层面。去年VLA迅速发展,从模仿走向深入理解物理世界。怎样让AI准确理解这个世界,提高它的泛化性和操作准确性,会成为关注点。
记者:央视春晚也联系了你们,最后为什么没有参加?
陈建宇:如果能够获得大范围正面的关注度,带动公司的估值、商业化收入,把投入赚回来,这个事情就是划算的。我们评估下来,C端场景不是当前的商业化主线。
记者:你们也做了很多运动控制方面的研究,去年机器人运动会上还拿了个跳高冠军。春晚上整齐划一的表演,技术难度高吗?
陈建宇:就像三级跳或者芭蕾舞表演,动作都是编排好的。一群机器人整齐划一表演技术难度也不高,类似无人机表演。
小机器人和大机器人的表现很不一样。大机器人运动控制更难。重量很高,惯性会更大,就像大象很难跳舞。
记者:后面你们去了北京卫视的春晚。
陈建宇:那个基本没花钱。我们本来就做了机器人舞剑的训练,然后他们邀请我们,正好就去了。
2
多线并进
记者:星动最近公布了VLAW和Ctrl-World,主要逻辑都是VLA和世界模型协作,在一些基准测试上表现很好。现在行业里都在说具身模型的路线没收敛,你们怎么决定要研究这个方向的?
陈建宇:我们一直在探索,原生的具身模型架构设计,到底要加哪些东西进去。
大模型最开始只有语言,后来有了视觉。大家一看有了视觉,就研究怎么把 Action(动作)放进去,这就是VLA。
我们当时做出了全球第一款完整的机器人VLA模型,比美国具身智能公司Physical Intelligence的VLA模型pi0还要早一些。
这是传统意义上的VLA,用遥操或其他方式获取这些操作数据,交给模型学习,模型没有思考动作背后的逻辑,纯粹模仿下来。学习大量动作后,能有一定的泛化性和智能,数据利用率非常低。
到了没有数据的环境后,这样的泛化性和智能是不够的。这就需要世界模型了。
我们2023年就开始做VLA,当时考虑到了世界推理的问题,但没有特别好实现的工具。直到Sora出来,看到它有接近我们想要的效果,可以精准地预测物理世界运转,能按照时间去往后推测动作。
我们从2024年开始做世界模型,应该是全球最早做世界模型for Robotics的团队。
引入世界模型,相比传统纯VLA的方式,效果平均能提高40%左右。
记者:有从业者认为,现阶段具身智能模型对世界模型的迫切性没有那么高。
陈建宇:如果只看眼前的一两年,这样说是可以的。如果看得长远,三到五年,就不行了。
现在业内比较主流的是VLA,架构相对比较收敛,我们已经在工业物流场景落地。
主流的VLA上限不高,单靠这套技术能做的事比较有限。且它的泛化性有限,机器人要做一个新事情时,到新点位还得收集很多数据,需要工程师去调,毛利很低。
目标是做到家用,需要提高机器人的智能天花板,当前的VLA路线支撑不了家用。
记者:现在VLA和世界模型结合的路线明确了吗?
陈建宇:世界模型和VLA主要有两种结合方式,我们都在研究。
一种是松耦合,比如VLAW、Ctrl-World。VLA模型和世界模型分成两个模型。VLA专注动作输出,世界模型专注于对未来的预测,训练过程中,两个同时迭代和增强。
模型获取到新动作数据,可以学习这个动作,输出技能。数据会反馈到World Model上改进。预测得更准以后,它又进一步可以做更好的行为和动作,双向迭代逐步增强。
一种是紧耦合,比如之前发布的VPP(Video Prediction Policy),是把这两个模型融合成一个模型。训练的方式还是类似,但模型同时输出动作和对未来的预测。
大的方向,就是围绕物理世界建模,怎么利用对物理世界的建模。具体路线怎么做,还属于前沿探索的领域,我们还开设了几个不同的研究分支。
记者:同时做很多分支的研究和探索,投入产出比怎么平衡?
陈建宇:每个分支投入的人员并不多,大概有几个人。
比如我课题组的研究合作伙伴Chelsea Finn所创立的PI(Physical Intelligence,美国具身智能公司),研究人员也不多,保持了很高的人才密度。
它不做商业化、生产制造,就做算法模型。现在大厂纯研究AI算法的团队规模也不大,能做这种创新的人是少数。
如果我们的某个路线得到验证,就会用到产品上,扩大数据规模、建立 Infra、产业化等,才会投入更多人。
记者:星动纪元在很多研究方向都是行业第一,估值却不是最高的。
陈建宇:我觉得这个现象也很正常。不是说你在哪一块技术做到了最前,就会获得最多的关注度、更高的估值。
现在行业各种各样的方案都有,缺乏一个非常统一的、让大家都能看到的 Benchmark。不是所有人都是专业人士,所以不知道该怎么去判断这件事。
后面大家对 “怎么样判断” 会逐步形成一些共识,包括到商业化落地,可以通过一些量化的数据或者业绩看出来。
记者:如果抛开限制,你最希望用哪种数据来训练模型?
陈建宇:真机数据。因为这是最直接的。
现在我们的训练数据主要有三种:遥操采集的数据,主要用在精调模型环节。二是最近火的 UMI(斯坦福大学等研究机构提出的机器人数据收集与策略学习框架),三是视频数据。这两类数据精度会低一些,主要用于预训练阶段。
记者:数据量达到什么样的级别,能够让现在的模型有质的提升?
陈建宇:1000小时是个门槛,能训练出一些make sense的东西;10000小时的数据,能训练出效果不错的模型;10万或者数十万小时的数据,能看出一些Scaling。
大家下一个要争的,是100万小时数据能训出什么样的模型。现在很难预测能达到什么效果。
3
关键价值
记者:在行业内,星动纪元的灵巧手似乎比人形机器人出名。手也是星动成立之后发布的第一款产品。为什么这么在意手?
陈建宇:因为手是核心,你所有的活儿都是通过手干的。
“皮层小人”(Cortical Homunculus)图片,它按照身体各个部位在大脑皮层里所占的脑细胞区域的大小,或者说控制比例来绘制的。
皮层小人示意图
手作为末端执行器,对大脑的发育很重要,对商业化很重要,对具体怎么干活也很重要。必须尽早把它攻克。
运动控制,比如走路、平衡,跟智商其实没太大关系。那个皮层小人,脚很小,只占大脑皮层很小的一部分。
我们希望把适配范围最广的东西打通,到达技术边界后,商业化的可能性就多了。
比如把最难的全尺寸双手双足机器人做出来后,我们很快就做出来了轮式双臂机器人,它也可以去赚钱。
记者:你在很多发言中会谈到机器人落地,要攻克高价值场景。你们怎么定义高价值场景?
陈建宇:就是市场天花板高。比如物流,分拣、上架、拣货等,随便一个环节都有大几百亿的成本。此外还有汽车、零售,包括 3C。
我们最近几轮也有很多产业方投资人进来,不光给钱,还有很多的资源、订单等。
记者:现在的人形机器人还不够耐用,硬件寿命不长的话,怎么高强度地推到物流场景中?
陈建宇:肯定要去解决它的一些老化的问题,进一步去延长它的使用寿命。
从另一个角度讲,也可以进一步降本。当成本降得足够低了之后,坏了你就直接换,把它当作易耗品来用。最终它的质量也不会太差的。
我们的手迭代了很多代,最开始是能用10万次,现在达到百万次,客户反馈我们的灵巧手的耐用度是其他手的4倍。
目标是达到千万次。1到2年内,就能达到工业夹爪的程度。它最底层的部件跟电动夹爪差不多,只不过是自由度多一些。
记者:前段时间具身行业内关于 “谁是出货量第一” 争议很热闹。看到大家都是几千台,你们在出货方面会焦虑吗?
陈建宇:我觉得还好,短期提升出货量不难。
目前的出货主要都是表演性质的,价值不高,也很难建立真正的壁垒。我们看重长期可持续的高价值出货量。
我们有两种商业模式:一个是面向真正的用户,主要是工厂,干活的同时也能收集数据。一个公司的带宽有限,我们会重点做几个行业场景,其他的交给二次开发商去做。
另一种是卖平台和供应链,我们有机器人本体和数据平台,可以作为产品售卖,机器人的手可以单独拆出来卖等等。可以获得一些收入,也能帮我们开拓客户。
记者:刚才你说星动更长期的规划是做家庭场景,现在开始行动了吗?
陈建宇:现在还不适合做家用机器人。我们做家务机器人,是让机器人干活,陪伴娱乐只是附加属性。
陪伴的话,需要人形吗?我放在手机里,随身携带会更好。这和具身智能关系不大。做这个东西,也不会帮我训练这套具身平台和技术体系。
我们先是挑选到了现在的具身技术,先往工业场景去落地,它更成熟,再进家庭做家务活。
一类是清洁,可以擦桌子、洗衣服,把脏衣篓的衣服放到洗衣机中,洗完后烘干、收纳。
另一类是厨房工作,协助做饭,类似机器人从冰箱里把菜拿出来。
再延伸的话,就是一套端到端的流程,AI根据你的喜好定制每天的食谱,规划什么时候去买菜;机器人买好菜以后,在冰箱里整理好,到时间了拿出来。
如果有炒菜机的话,它操作炒菜机,再端到盘子里盛上来,吃完后给你洗碗。另外也可以让它下楼取快递,陪你去打球、踢球等。机器人市场的想象力是非常丰富的。
当然现在还太早。我们认为机器人的ChatGPT时刻,大概是5年时间。
如果过两年我做一款只能擦桌子、洗碗的机器人,卖两三万元,也会有人买。
记者:你家里有机器人吗?
陈建宇:我家里太小,放不下。
4
技术达人
记者:有从业者评价,星动纪元陈老师做学术和研究很强,其他方面很容易被忽悠和拿捏。
陈建宇:这很正常。我是学者出身,大家对我的评价更多是,中国具身公司1号位里,最懂技术的。我本来就不是一个商人。
商业化最终是看结果。如果现在说,我做商业化很牛,很有天赋,也没人信。我们去年的收入虽然不及行业内最头部多公司,但也属于行业前列。
硬科技的创业不是纯商业模式的事情,它一定是技术+商业落地,我会运用我的强项。
记者:28岁基本上是博士生毕业的年纪,你就成了清华博导。你觉得自己是天才吗?
陈建宇:每个人都有天才之处,重要的是找到自己的天才之处。
记者:你觉得自己的天才之处是什么?
陈建宇:快速学习、洞察,并构建复杂系统的能力,机器人就是这样的系统,软硬件同时在快速演变。
记者:现在你又多了创业者的身份,需要管理的人也变多了,处理的事情也更复杂。你怎么学习?
陈建宇:我觉得管理的架构和目标管理是最重要的,是把所有事情串起来的关键。之后就是怎么去激励大家,很开心地去做事情,甚至争先恐后地把它做得更好。
记者:有什么你觉得需要学习或参考的公司吗?
陈建宇:我会重点关注几类公司,比如阿里、字节、腾讯等互联网大厂;华为、小米这些涉及到硬件的科技公司;新能源车企“蔚小理” 等等。
我会重点学习他们的公司是怎么发展的,组织架构是怎么设计的,商业化怎么做等。
记者:现在有各种各样的具身智能公司。如果你给这些公司划个派系,你会用什么指标划?
陈建宇:按大的技术投入度去划分,分本体派、大脑派和软硬一体或全栈派。
宇树就是本体派,它也在做双足,有了双足才值得做运控,也研究大脑,但还是以本体运控为重,类似的还有逐际动力、众擎等。
做大脑的公司,也不是没有本体,只是以大脑为重,大脑公司的代表就是银河通用、自变量。
大部分公司主要是轮式体系,不会涉及到太多的强化学习,比如双足运控、关节模组、硬件研发等核心底层。
然后是软硬全栈派,我们就属于这一派。智元也属于全栈派,但它是由很多个事业部或子公司组成。
我们找对标的话,大家会觉得我们更像是Figure或特斯拉。
如果是说我们抄Figure的话我不太同意,我们有一些与模型相关的观点,比Figure更早披露出来。我们做的事情,跟他们的路径和愿景也比较匹配,所以想的东西差不多。
记者:Figure估值390亿美元,约人民币2700亿元。
陈建宇:我们也希望估值能更进一步。
本质估值是一个公司真实价值的体现,但现在噪音比较多,导致估值不确定性高。
首先中美就有差异,加上Figure创始人是一位连续、成功的创业者。对我们来说,扎扎实实做好自己事情的同时,加强资本侧的布局。
记者:公司要做到多大,才能实现你的目标?
陈建宇:做成万亿市值的巨头。现在大家估值都在蹭蹭往上走,可能到我发展的时候,成为巨头就得接近万亿。
记者:你会和投资人、员工讲你要做万亿市值公司的目标吗?大家怎么想?
陈建宇:肯定是说过。员工有人信,也有人不信;投资人会说,搞起来搞起来。
记者:这个目标预计多久能实现?
陈建宇:要实现就得在10年内。













