【TR35】具身智能如何“有用”?加州大学伯克利分校博士后罗剑岚 发布时间:2025-05-30 09:34:18


他是让机器人“用手做事”的中国面孔,是让“真机强化学习”成为现实的破局者。他是入选2024年《麻省理工科技评论》“35岁以下科技创新35人”(TR35)榜单的加州大学伯克利分校博士后、人工智能与机器人专家罗剑岚。



在一段操作看似流畅的视频中,一只机器人手持鞭状工具,从层层叠放的积木堆中精准抽出指定积木块。它动作柔顺、位姿稳定,完成了高度精密的操作任务。对人类来说,这不仅需要肌肉控制的极度细腻,还要在毫厘之间掌控物理世界的不确定性。而HIL-SERL系统中的机器人,在短短两小时训练后,就实现了100%的成功率。


01

操控优先,

突破“大脑”短板


当前多数机器人“会走会跳”,却难以完成操作任务,暴露出“重运动、轻操控”的结构性短板。罗剑岚并非“让机器人跳舞更流畅”,而是“让它学会用手做事”。

“操控能力是目前最短缺的能力,这一直是机器人行业皇冠上的明珠。”罗剑岚指出。他强调,当前许多机器人系统仍停留在“运动能力”展示阶段,但真正推动生产力的,是具身智能系统的“操作力”,即应对不确定环境的灵巧反应能力。


“当机器人必须识别不同材质、抓取不同形状并组装部件时,面对的是一个高度不确定、动态变化的开放系统。”罗剑岚说,这种区别,决定了技术价值是否真正落地。


罗剑岚便投身于机器人控制与强化学习的交叉研究已有10年。在UC Berkeley读博期间,他便系统性构建了面向真实物理世界的学习框架。2022年博士后回归伯克利人工智能实验室(BAIR)后,他带领团队开发出全球首个在多任务上达到或超越人类水平的真机RL系统HIL-SERL(参考模仿学习基线)。


该系统突破性地实现了机器人在复杂操作任务中的全面泛化能力,完成抽取积木、安装皮带轮、电脑主板装配等一系列高精度、多约束动作任务,且任务成功率达100%。


HIL-SERL最大的不同,是“以真机数据为核心”,放弃对仿真的依赖。这意味着每一次操作反馈都来自真实世界,机器人必须在极高的不确定性下迅速建模和反应。这正是“操控”在具身智能中所代表的技术核心——不仅仅是能动,更是能理解物理世界并精准交互。


“仿真器无法模拟真实世界的复杂性,唯有直面物理交互数据,才能实现真正的智能进化。”罗剑岚说。他相信,唯有技术与场景共生,才能真正打开未来的智能系统之门。



02

科研与产业

形成正向飞轮



从UC Berkeley到Google X、再回到Berkeley,罗剑岚几乎横跨了机器人领域最顶尖的学术与工业场域。他始终强调:科研与产业之间不是两条独立的路径,而是一个可以彼此赋能、持续反馈的正向飞轮,“场景锤炼算法,算法反哺场景。”


在伯克利,他聚焦算法机制创新,用强化学习解决“样本效率”“任务泛化”等基础难题;而在谷歌,他亲历工业界对系统可靠性、可部署性与硬件耦合性的极致要求。


“我建议青年研究者,不要只关注能否发顶刊论文,更要思考问题本身是否值得花时间。”他说,只有将科研问题放入实际系统中运行,经历反馈、修正、再提升,才能真正形成技术飞轮。


尽管当前多个机器人平台已在实验室中展现惊艳表现,但距离真正应对工业级复杂环境,仍面临鲁棒性、实时性与自适应能力的严峻挑战。


通用人形机器人距离真正“有用”还缺哪些技术拼图?罗剑岚的答案是“闭环能力”,即机器人系统不仅能执行任务,还能从每一次交互中学习、改进。他提出,未来10年,真正的通用具身智能系统,必须具备这种“带记忆”的学习能力——不是靠硬编码或海量标注数据,而是靠自身交互中不断获得经验。


“这是一种能从过去的失败和成功中提炼策略的能力。”他说。比如一个机器人在初次尝试装配零件失败后,不是回到仿真重头再来,而是能立即理解偏差并调整策略,这种动态学习,是工业落地的必要前提。


“在谷歌期间,我深刻体会到工程可靠性的重要性;在伯克利,我敢于突破基础科学。这种双重历练,构成了我今天理解技术的方式。”罗剑岚说。


03

从Demo到部署

走出实验室



随着通用机器人研发逐步进入深水区,如何从演示级技术走向工程部署,成为评判技术成熟度与产业价值的关键尺度。

对罗剑岚而言,TR35不仅是荣誉,更是一份责任。“我希望把这个荣誉化作一种推动力。”他说,“过去10年,我们让强化学习在真实机器人上跑起来;接下来的10年,我们要让它真正产生价值。”


几个月前,罗剑岚正式加入智元机器人,担任首席科学家。他牵头组建的“具身智能研究中心”专注于“大小脑一体”的系统研究与落地。这一研究方向,聚焦“场景驱动的具身智能数据采/训/推一体化综合平台”“多模感知仿人灵巧手及具身交互控制技术研究与验证”等核心课题,得到了上海市科委“科技创新行动计划-新一代信息技术领域技术攻关(第一批)项目”的支持。


“我们的目标,是让机器人24×7地在真实世界中工作,不再只是Demo。”他说。他相信,机器人走出实验室进入现实世界的“窗口期”正在到来。


“我希望未来的具身智能系统,可以真正在工厂中装配产品,在无人便利店里搬运货架,甚至在危险区域中代替人类作业。”这是他正着手构建的“闭环”。


“让机器人成为现实世界的一员”,这不仅是他的科研方向,更是他对未来技术与社会的承诺。


转载From:上海科技