大风号

28岁成为清华博导，机器人老板憧憬万亿

21财闻汇

03-16 21:04 来自广东省

作者：陈佳惠

“大家估值都在蹭蹭往上走，我们要成为巨头就得万亿市值。”

2025年11月，星动纪元完成10亿元融资后，创始人、CEO陈建宇表示。

接下来三个多月，具身智能行业20多家公司融资超过200亿元。星动纪元又完成一轮10亿元的新融资，三星和高成投资领投，估值突破100亿元。

“融资不只是融钱，也是融资源。”

陈建宇说，现在许多机构意识到具身值得投入，积极融资能把好的战略合作伙伴绑定在同一个阵营里，扩大竞争优势。

出生于1992年，陈建宇19岁考上清华大学，毕业设计研究 “双足机器人步态规划”；在加州大学伯克利分校读博时，他重点研究如何把强化学习融入到机器人控制中，期间还去无人驾驶公司Waymo和Nutonomy实习过。

陈建宇

2020年毕业后，陈建宇回到清华大学，担任交叉信息研究院助理教授，机器人是主要的研究方向。

28岁，大多数博士刚毕业的年纪，陈建宇成为博士生导师。2023年，他创办星动纪元。

“陈（助理）教授比较务实。” 一位投资人说，这是他投资星动纪元的原因之一。

2025年7月，陈建宇给团队找新办公室时，挑了一家在线教育公司的办公室，“装修看起来还不错，办公桌椅能继续用，能省下一笔费用”。

陈建宇如今每天骑电动车上班，住的房子也不够人形机器人施展。

经营一家具身智能公司，陈建宇足够大气。他选择研究有灵巧手、双腿的全尺寸人形机器人；既追求机器人的运动控制能力，又投入资源研发具身智能模型。

模型层面，他们同时研究 VLA 和世界模型结合的不同分支，“单靠一套技术能做的事比较有限”。

整个行业只有市值1.5万亿美元的特斯拉、融资近20亿美元的Figure，和两年融资10轮的智元机器人这样做。

陈建宇认为，这就是最大的务实，“先把最难、适配范围最广的部分做了，商业化的可能性就多了。”

他分享了自己关于具身智能模型路线、商业化的理解，以及他看到的行业的下一个赛点。

聚拢资源

记者：星动纪元两轮融资都拿了10亿元，中间只隔了3个月。为什么这么积极融资？

陈建宇：融资融的不只是钱，也是融资源。很好的战略合作伙伴，可以通过融资绑定到一个阵营里，未来我们竞争会拥有更好的生态位。

比如我们的领投方三星，也是我们客户，当时他们是中国投一家，美国投一家，韩国投一家。

2024年开始，大家就在想这个行业会不会往下砸，后面（融资）越来越夸张。回望之前，大家没有投进蔚小理时也后悔，之前觉得估值太高了，但现在来看，估值完全不高。芯片、大模型行业一样。

互联网这些行业会有泡沫破灭的风险，因为如果发现是伪需求，行业就不存在了。

硬科技不是这样，需求是真实存在的，它背后是生产力提升。大家对技术发展速度预判过高或过低，会有一些波动。长期来看，它（的趋势）肯定是稳步地上升。

记者：这两轮的投资方里，有多少机构是第一次投具身？

陈建宇：还是有不少。很多老股东也想跟投，但我们没有额度了。比如我们这次另一个联合领投方高成资本，就是第一次投。也有很多二级机构的人来问我，能不能把二级的钱现在就投到公司里。（笑）

记者：春节之后，至少有五家具身公司宣布完成了超十亿的融资。大家拿这么多钱，争的是什么？

陈建宇：大家其实是在赛跑。赛跑我们的技术，赛跑商业化的速度。终点都是商业化的成功，谁能先把这个真正高价值的、具备规模化能力的产品给做出来。

记者：融了这么多钱，打算怎么花出去？

陈建宇：具身智能链条比较长，花钱的地方不少。

比如硬件生产、制造，模型的训练、数据收集，都是大头。到后面商业化，机器人是实物，中间的渠道、销售等，也要花钱。

现在模型还没有到规模特别大，商业化也还没大规模铺开，花钱相对少一些。当它规模化时，消耗资金速度会加快，现在融资也是提前为以后做好准备。

记者：两轮融资之间，能看到具身智能行业发生什么实质变化吗？

陈建宇：行业越来越重视技术的最终落地了。机器人上春晚，首先增强的是信心，观众们看机器人跳舞会发现，机器人一年的时间进展可以这么快。

现在来看，跳舞也是一种商业模式。但行业变化非常快，具身公司一定要找到第二增长曲线，一定在工业类、生产类的场景里面。今年和明年很关键，机器人要从跳舞走向干活，真正意义上去干活，而不是秀个Demo。

另外是模型层面。去年VLA迅速发展，从模仿走向深入理解物理世界。怎样让AI准确理解这个世界，提高它的泛化性和操作准确性，会成为关注点。

记者：央视春晚也联系了你们，最后为什么没有参加？

陈建宇：如果能够获得大范围正面的关注度，带动公司的估值、商业化收入，把投入赚回来，这个事情就是划算的。我们评估下来，C端场景不是当前的商业化主线。

记者：你们也做了很多运动控制方面的研究，去年机器人运动会上还拿了个跳高冠军。春晚上整齐划一的表演，技术难度高吗？

陈建宇：就像三级跳或者芭蕾舞表演，动作都是编排好的。一群机器人整齐划一表演技术难度也不高，类似无人机表演。

小机器人和大机器人的表现很不一样。大机器人运动控制更难。重量很高，惯性会更大，就像大象很难跳舞。

记者：后面你们去了北京卫视的春晚。

陈建宇：那个基本没花钱。我们本来就做了机器人舞剑的训练，然后他们邀请我们，正好就去了。

多线并进

记者：星动最近公布了VLAW和Ctrl-World，主要逻辑都是VLA和世界模型协作，在一些基准测试上表现很好。现在行业里都在说具身模型的路线没收敛，你们怎么决定要研究这个方向的？

陈建宇：我们一直在探索，原生的具身模型架构设计，到底要加哪些东西进去。

大模型最开始只有语言，后来有了视觉。大家一看有了视觉，就研究怎么把 Action（动作）放进去，这就是VLA。

我们当时做出了全球第一款完整的机器人VLA模型，比美国具身智能公司Physical Intelligence的VLA模型pi0还要早一些。

这是传统意义上的VLA，用遥操或其他方式获取这些操作数据，交给模型学习，模型没有思考动作背后的逻辑，纯粹模仿下来。学习大量动作后，能有一定的泛化性和智能，数据利用率非常低。

到了没有数据的环境后，这样的泛化性和智能是不够的。这就需要世界模型了。

我们2023年就开始做VLA，当时考虑到了世界推理的问题，但没有特别好实现的工具。直到Sora出来，看到它有接近我们想要的效果，可以精准地预测物理世界运转，能按照时间去往后推测动作。

我们从2024年开始做世界模型，应该是全球最早做世界模型for Robotics的团队。

引入世界模型，相比传统纯VLA的方式，效果平均能提高40%左右。

记者：有从业者认为，现阶段具身智能模型对世界模型的迫切性没有那么高。

陈建宇：如果只看眼前的一两年，这样说是可以的。如果看得长远，三到五年，就不行了。

现在业内比较主流的是VLA，架构相对比较收敛，我们已经在工业物流场景落地。

主流的VLA上限不高，单靠这套技术能做的事比较有限。且它的泛化性有限，机器人要做一个新事情时，到新点位还得收集很多数据，需要工程师去调，毛利很低。

目标是做到家用，需要提高机器人的智能天花板，当前的VLA路线支撑不了家用。

记者：现在VLA和世界模型结合的路线明确了吗？

陈建宇：世界模型和VLA主要有两种结合方式，我们都在研究。

一种是松耦合，比如VLAW、Ctrl-World。VLA模型和世界模型分成两个模型。VLA专注动作输出，世界模型专注于对未来的预测，训练过程中，两个同时迭代和增强。

模型获取到新动作数据，可以学习这个动作，输出技能。数据会反馈到World Model上改进。预测得更准以后，它又进一步可以做更好的行为和动作，双向迭代逐步增强。

一种是紧耦合，比如之前发布的VPP（Video Prediction Policy），是把这两个模型融合成一个模型。训练的方式还是类似，但模型同时输出动作和对未来的预测。

大的方向，就是围绕物理世界建模，怎么利用对物理世界的建模。具体路线怎么做，还属于前沿探索的领域，我们还开设了几个不同的研究分支。

记者：同时做很多分支的研究和探索，投入产出比怎么平衡？

陈建宇：每个分支投入的人员并不多，大概有几个人。

比如我课题组的研究合作伙伴Chelsea Finn所创立的PI（Physical Intelligence，美国具身智能公司），研究人员也不多，保持了很高的人才密度。

它不做商业化、生产制造，就做算法模型。现在大厂纯研究AI算法的团队规模也不大，能做这种创新的人是少数。

如果我们的某个路线得到验证，就会用到产品上，扩大数据规模、建立 Infra、产业化等，才会投入更多人。

记者：星动纪元在很多研究方向都是行业第一，估值却不是最高的。

陈建宇：我觉得这个现象也很正常。不是说你在哪一块技术做到了最前，就会获得最多的关注度、更高的估值。

现在行业各种各样的方案都有，缺乏一个非常统一的、让大家都能看到的 Benchmark。不是所有人都是专业人士，所以不知道该怎么去判断这件事。

后面大家对 “怎么样判断” 会逐步形成一些共识，包括到商业化落地，可以通过一些量化的数据或者业绩看出来。

记者：如果抛开限制，你最希望用哪种数据来训练模型？

陈建宇：真机数据。因为这是最直接的。

现在我们的训练数据主要有三种：遥操采集的数据，主要用在精调模型环节。二是最近火的 UMI（斯坦福大学等研究机构提出的机器人数据收集与策略学习框架），三是视频数据。这两类数据精度会低一些，主要用于预训练阶段。

记者：数据量达到什么样的级别，能够让现在的模型有质的提升？

陈建宇：1000小时是个门槛，能训练出一些make sense的东西；10000小时的数据，能训练出效果不错的模型；10万或者数十万小时的数据，能看出一些Scaling。

大家下一个要争的，是100万小时数据能训出什么样的模型。现在很难预测能达到什么效果。

关键价值

记者：在行业内，星动纪元的灵巧手似乎比人形机器人出名。手也是星动成立之后发布的第一款产品。为什么这么在意手？

陈建宇：因为手是核心，你所有的活儿都是通过手干的。

“皮层小人”（Cortical Homunculus）图片，它按照身体各个部位在大脑皮层里所占的脑细胞区域的大小，或者说控制比例来绘制的。

皮层小人示意图

手作为末端执行器，对大脑的发育很重要，对商业化很重要，对具体怎么干活也很重要。必须尽早把它攻克。

运动控制，比如走路、平衡，跟智商其实没太大关系。那个皮层小人，脚很小，只占大脑皮层很小的一部分。

我们希望把适配范围最广的东西打通，到达技术边界后，商业化的可能性就多了。

比如把最难的全尺寸双手双足机器人做出来后，我们很快就做出来了轮式双臂机器人，它也可以去赚钱。

记者：你在很多发言中会谈到机器人落地，要攻克高价值场景。你们怎么定义高价值场景？

陈建宇：就是市场天花板高。比如物流，分拣、上架、拣货等，随便一个环节都有大几百亿的成本。此外还有汽车、零售，包括 3C。

我们最近几轮也有很多产业方投资人进来，不光给钱，还有很多的资源、订单等。

记者：现在的人形机器人还不够耐用，硬件寿命不长的话，怎么高强度地推到物流场景中？

陈建宇：肯定要去解决它的一些老化的问题，进一步去延长它的使用寿命。

从另一个角度讲，也可以进一步降本。当成本降得足够低了之后，坏了你就直接换，把它当作易耗品来用。最终它的质量也不会太差的。

我们的手迭代了很多代，最开始是能用10万次，现在达到百万次，客户反馈我们的灵巧手的耐用度是其他手的4倍。

目标是达到千万次。1到2年内，就能达到工业夹爪的程度。它最底层的部件跟电动夹爪差不多，只不过是自由度多一些。

记者：前段时间具身行业内关于 “谁是出货量第一” 争议很热闹。看到大家都是几千台，你们在出货方面会焦虑吗？

陈建宇：我觉得还好，短期提升出货量不难。

目前的出货主要都是表演性质的，价值不高，也很难建立真正的壁垒。我们看重长期可持续的高价值出货量。

我们有两种商业模式：一个是面向真正的用户，主要是工厂，干活的同时也能收集数据。一个公司的带宽有限，我们会重点做几个行业场景，其他的交给二次开发商去做。

另一种是卖平台和供应链，我们有机器人本体和数据平台，可以作为产品售卖，机器人的手可以单独拆出来卖等等。可以获得一些收入，也能帮我们开拓客户。

记者：刚才你说星动更长期的规划是做家庭场景，现在开始行动了吗？

陈建宇：现在还不适合做家用机器人。我们做家务机器人，是让机器人干活，陪伴娱乐只是附加属性。

陪伴的话，需要人形吗？我放在手机里，随身携带会更好。这和具身智能关系不大。做这个东西，也不会帮我训练这套具身平台和技术体系。

我们先是挑选到了现在的具身技术，先往工业场景去落地，它更成熟，再进家庭做家务活。

一类是清洁，可以擦桌子、洗衣服，把脏衣篓的衣服放到洗衣机中，洗完后烘干、收纳。

另一类是厨房工作，协助做饭，类似机器人从冰箱里把菜拿出来。

再延伸的话，就是一套端到端的流程，AI根据你的喜好定制每天的食谱，规划什么时候去买菜；机器人买好菜以后，在冰箱里整理好，到时间了拿出来。

如果有炒菜机的话，它操作炒菜机，再端到盘子里盛上来，吃完后给你洗碗。另外也可以让它下楼取快递，陪你去打球、踢球等。机器人市场的想象力是非常丰富的。

当然现在还太早。我们认为机器人的ChatGPT时刻，大概是5年时间。

如果过两年我做一款只能擦桌子、洗碗的机器人，卖两三万元，也会有人买。

记者：你家里有机器人吗？

陈建宇：我家里太小，放不下。

技术达人

记者：有从业者评价，星动纪元陈老师做学术和研究很强，其他方面很容易被忽悠和拿捏。

陈建宇：这很正常。我是学者出身，大家对我的评价更多是，中国具身公司1号位里，最懂技术的。我本来就不是一个商人。

商业化最终是看结果。如果现在说，我做商业化很牛，很有天赋，也没人信。我们去年的收入虽然不及行业内最头部多公司，但也属于行业前列。

硬科技的创业不是纯商业模式的事情，它一定是技术+商业落地，我会运用我的强项。

记者：28岁基本上是博士生毕业的年纪，你就成了清华博导。你觉得自己是天才吗？

陈建宇：每个人都有天才之处，重要的是找到自己的天才之处。

记者：你觉得自己的天才之处是什么？

陈建宇：快速学习、洞察，并构建复杂系统的能力，机器人就是这样的系统，软硬件同时在快速演变。

记者：现在你又多了创业者的身份，需要管理的人也变多了，处理的事情也更复杂。你怎么学习？

陈建宇：我觉得管理的架构和目标管理是最重要的，是把所有事情串起来的关键。之后就是怎么去激励大家，很开心地去做事情，甚至争先恐后地把它做得更好。

记者：有什么你觉得需要学习或参考的公司吗？

陈建宇：我会重点关注几类公司，比如阿里、字节、腾讯等互联网大厂；华为、小米这些涉及到硬件的科技公司；新能源车企“蔚小理” 等等。

我会重点学习他们的公司是怎么发展的，组织架构是怎么设计的，商业化怎么做等。

记者：现在有各种各样的具身智能公司。如果你给这些公司划个派系，你会用什么指标划？

陈建宇：按大的技术投入度去划分，分本体派、大脑派和软硬一体或全栈派。

宇树就是本体派，它也在做双足，有了双足才值得做运控，也研究大脑，但还是以本体运控为重，类似的还有逐际动力、众擎等。

做大脑的公司，也不是没有本体，只是以大脑为重，大脑公司的代表就是银河通用、自变量。

大部分公司主要是轮式体系，不会涉及到太多的强化学习，比如双足运控、关节模组、硬件研发等核心底层。

然后是软硬全栈派，我们就属于这一派。智元也属于全栈派，但它是由很多个事业部或子公司组成。

我们找对标的话，大家会觉得我们更像是Figure或特斯拉。

如果是说我们抄Figure的话我不太同意，我们有一些与模型相关的观点，比Figure更早披露出来。我们做的事情，跟他们的路径和愿景也比较匹配，所以想的东西差不多。

记者：Figure估值390亿美元，约人民币2700亿元。

陈建宇：我们也希望估值能更进一步。

本质估值是一个公司真实价值的体现，但现在噪音比较多，导致估值不确定性高。

首先中美就有差异，加上Figure创始人是一位连续、成功的创业者。对我们来说，扎扎实实做好自己事情的同时，加强资本侧的布局。

记者：公司要做到多大，才能实现你的目标？

陈建宇：做成万亿市值的巨头。现在大家估值都在蹭蹭往上走，可能到我发展的时候，成为巨头就得接近万亿。

记者：你会和投资人、员工讲你要做万亿市值公司的目标吗？大家怎么想？

陈建宇：肯定是说过。员工有人信，也有人不信；投资人会说，搞起来搞起来。

记者：这个目标预计多久能实现？

陈建宇：要实现就得在10年内。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

打开 app 阅读更多精彩内容

热点新闻