智元论坛深度解析：Sergey详解机器人基础模型进阶之路

2025-08-08 11:44:40 来源: 浏览:20次

2025世界人工智能大会期间，由智元机器人主办的“智启具身论坛”上，Physical Intelligence联合创始人兼UC Berkeley副教授Sergey带来了关于机器人基础模型的深度见解。

机器人基础模型的探索以视觉语言动作（VLA）模型为重要起点。初代VLA模型RT-2开启了将机器人控制转化为“问答任务”的尝试，而RTX跨具身数据集的应用是一大关键突破。该数据集整合多实验室、多机器人数据，使融合多机器人数据训练的RT-2X在各实验室专属任务上表现出色，平均优于实验室自研专用模型50%，尤其在应对分布外指令时，性能是单一机器人数据训练模型的3倍，充分展现了跨具身训练的优势，即数据多样性对通用能力培养的重要性。这一突破与智元机器人推动的“开放生态”理念不谋而合，其主办的论坛正致力于汇聚跨实验室资源，加速通用技术的落地。

第二代VLA模型针对初代将动作视为离散词元难以完成灵巧操作的局限，实现了从离散到连续的动作革命。像PI-Zero引入基于流匹配生成连续动作的“动作专家模块”，在折叠衣物、组装盒子等复杂任务中，即便遭遇人为干扰，也能凭借连续动作生成机制对物理交互的细腻捕捉，恢复并完成任务，极大提升了机器人执行复杂任务的能力。

PI-0.5作为进阶版本，通过“高级-低级推理融合”，为长期复杂任务执行带来新突破。它能将“清理卧室”等高级指令分解为子步骤，再生成动作，可在训练集未出现的卧室场景中自主完成一系列连贯操作。且其仅3%的训练数据来自移动操作机器人，却能在真实家居场景泛化，说明跨具身训练可助力模型获得对物理世界的通用理解。

展望未来，Sergey指出当前VLA模型短板在于仅通过模仿训练，未针对任务成功等进行优化。因此，融合强化学习技术成为必然趋势，通过强化学习优化模型，再将其训练的“专用技能”融入VLA模型，实现“通用模型+专用技能”的结合。

作为行业生态的构建者，智元机器人正通过“智启具身论坛”等平台，推动这类技术融合的实践落地，让机器人基础模型在物理世界中既具备通用常识又拥有场景专长，为具身智能的规模化应用开辟新路径。

Tags：论坛深度解析 Sergey 详解机器人基础模型进阶

发布者：千寻

【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：良心揭露柿饼市场惊天骗局！亲赴产地，发现富平柿饼真相！

下一篇：智启具身论坛：Sergey聚焦机器人..

推荐文章

·和甲流患者密闭两周不被感染是怎么做到的

·即便毫无血缘关系，长相相似的人也有大量相同的DNA

·北极挖出史前生物尸体，为何人类会感到不安，潘多拉..

·南京高淳：突出重点加强夏季食品安全风险隐患排查

·融创郑州空港宸院：航空港区九年回望，初心不改，势..

·云力量，在广袤的燕赵大地上生根开花

·惠民保客户可享20%费率优惠，慧择医享无忧惠享版创新..

·以“小家”服务“大家”联结“万家”

·水资源宣传进校园节水护水从我立

·燃奋斗青春展市监风采：南京市高淳区市场监管局召开..

·陕西知名医学专家到访赛铱高（西安）生物科技

·坚持半年就能练出强壮肌肉的人，有什么技巧？

·令徐悲鸿夫人赞不绝口的现代著名写意牛画家，丁荦

·重磅！无锡纯熙生物科技有限公司联合苏州大学签订战..

·主动参加战“疫”！河北三力健康承担新冠病毒核酸检..

·《青春的力量》嘉宾团清晨挑战曲艺学戏，探访三国圣..

·暖心！学霸说保向民警、医护、环卫一线工作者捐赠口..

·北渡派出所户籍民警春节坚守为民服务一线

·北渡派出所户籍民警直面疫情坚守为民服务一线

·瑞金车站派出所组织民警开展“110宣传日”宣传活动

图片主题

主动觉醒：锦上科技卢泰宇解码民企代际传承	通威集团：双轮驱动的成功之道
运营不到一年，这家宠物出行机构为何就崭露头..	刘稳：从供应链到酒店业的价值重构实践者

最新文章

·主动觉醒：锦上科技卢泰宇解码民企代际传承

·通威集团：双轮驱动的成功之道

·中交路建北方公司长白山公路土建项目前川大桥新建侧预

·运营不到一年，这家宠物出行机构为何就崭露头角？

·刘稳：从供应链到酒店业的价值重构实践者

·旅安红钻 x 天猫超级品类日：赏阳朔山水，绘旅行新篇

·打破桎梏，智领未来：同元软控MWORKS 2025b正式发布

·李沧区屿涧健康养生馆——跨界融合，探索“传媒+心理”

·《健康脱口秀・第 5 季》全国邀请赛复赛四十八强

·止咳无忧，创意无限丨贵州百灵2025青春盛典荣耀收官！

·智校伴学合作伙伴采访特辑：教培转型创业的四重突围

·星德互动与本地高校正式签署战略合作协议

·“声润三秦工兴乡韵”：陆基“智”养，岚皋鲟跃，推普

·宁波宝轩堂医药有限公司：以质量为基、以责任为翼，铸

·天津康汇医院：功能性人工晶体助白内障患者告别模糊视

·天津康汇医院搭台呼吸领域大咖共话间质性肺疾病诊疗新

·天津康汇医院承办呼吸年会，京津冀专家共探间质性肺疾

·数智化拼图+混凝土AI课堂 ——中国国际混凝土博览会，

·菲尔莱：流淌在生活中的智慧

·中国——大同第三届弹拨文化艺术节圆满成功！

梅苑影业闪耀第二十五届世纪大采风年度盛典，以责任担当书..	安全性价比双修：10-15万最靠谱的三款新能源轿车推荐	20万预算，适合家用的6座SUV？eπ008值得考虑	清河之洲奏响节水乐章海淀区“节水嘉年华”活动亮点纷呈
比亚迪方程豹科技潮品钛3开启预售，5大版本最低仅需13.98万..	游戏《凝渊》开启付费测试：国产女性向二次元手游探索叙事..	中国移动AI赋能非遗春节，传递数智时代浓浓年味	共庆有AI中国年，中国移动打造科技赋能非遗春节新范式

新人限时福利