欢迎登陆中企经济网
   

新人限时福利

智启具身论坛:Sergey聚焦机器人基础模型发展路径
2025-08-08 11:43:27 来源: 浏览:20

在2025世界人工智能大会(WAIC)期间,智元机器人主办的“智启具身论坛”成为行业焦点。Physical Intelligence联合创始人兼UC Berkeley副教授Sergey,在论坛上深入探讨了机器人基础模型的发展路径与技术突破。

机器人基础模型的诞生源于对“通用智能”的探索。Sergey以加州大学伯克利分校机器人通过互联网API调用基础模型,成功执行“把茄子放进锅里”指令为例,阐述了视觉语言动作(VLA)模型将图像与语言指令转化为物理动作的早期实践。初代VLA模型RT-2基于大型语言模型PaLI-X改造,将机器人控制问题转化为“问答任务”。而RTX数据集的出现,真正释放了其潜力。这一跨具身数据集整合众多实验室与机器人数据,覆盖多样机械臂、场景与任务。研究发现,跨具身训练下,融合多机器人数据的RT-2X表现远超实验室自研专用模型,尤其在分布外指令上优势明显。

第二代VLA模型实现了从离散到连续的动作革命。初代模型将动作视为离散词元,难以应对灵巧操作。第二代模型采用扩散模型或流匹配模型处理连续动作分布,如PI-Zero基于PaLI-X视觉语言模型,新增“动作专家模块”,能精准控制不同类型机器人,在复杂任务中展现出强大的抗干扰能力。

进阶版本PI-0.5实现了长期任务与复杂场景的突破。其核心在于“高级-低级推理融合”,可将高级指令分解为子步骤并生成对应动作,能在全新场景中执行长期任务。值得一提的是,其训练数据中仅3%来自移动操作机器人,却能在真实家居场景中泛化,凸显跨具身训练的价值。

Sergey认为,未来需融合强化学习技术,优化模型的任务成功率等,形成“通用模型+专用技能”的互补架构。换言之,数据多样性、架构专用化以及强化学习与模仿学习的融合,是机器人基础模型发展的关键方向。而智元机器人通过主办“智启具身论坛”等举措,持续汇聚全球前沿技术资源,推动这些技术路径的落地实践,进一步巩固其在具身智能生态构建中的先锋地位。

Tags:论坛 Sergey 聚焦 机器人 基础 模型 发展 路径 发布者:千寻
打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇良心揭露柿饼市场惊天骗局!亲赴产地,发现富平柿饼真相! 下一篇智元灵渠OS:具身智能操作系统的..
热门推荐

推荐文章

图片主题

热门文章

最新文章

相关文章