![]() |
智元打造具身智能“算法-评测”协同新范式,开启低成本高效研发新时代
近日,智元机器人在具身智能领域实现双重技术突破,正式开源全球首个机器人动作序列驱动的世界模型框架EVAC(EnerVerse-AC)及具身世界模型评测基准EWMBench。此举标志着智元在破解行业“真机验证成本高、数据利用效率低”的双重难题上取得关键进展。智元为全球开发者构建起“低成本模拟-标准化评测-高效迭代”的全新研发范式,有力推动具身智能技术迈向协同进化新阶段。
当前具身智能发展面临两大核心瓶颈。一方面,验证成本高企,真机测试存在显著的硬件损耗与安全风险,而传统仿真系统又因“虚实偏差”难以精准复现复杂的物理交互过程。另一方面,数据价值被埋没,海量真机操作轨迹尚未建立起高效的扩增机制,导致模型训练数据多样性严重不足,制约了模型性能提升。智元机器人精准洞悉这些行业痛点,依托自研的EnerVerse世界模型架构持续创新,推出了EVAC框架与EWMBench评测基准,形成了一套覆盖从模型训练到效果评估的全链路闭环解决方案。 作为智元机器人研发的全球首创技术,EVAC框架实现了物理-像素精准映射、动态多视图生成、数据价值深度激活三大颠覆性创新。通过创新的6D机械臂位姿与末端执行器行程的ActionMap编码技术,实现了机器人动作与像素级视觉动态的端到端精确对齐,该技术能够精准建模抓取、抛掷、碰撞等复杂动力学行为。并且集成了创新的RayMap相机轨迹编码技术,支持头部/腕部等多视角场景的协同生成。在长时序一致性方面取得突破,单视图可稳定生成长达30段的连续画面,多视图也能维持10段的无漂移输出。EVAC框架融合了Agibot-World数据集以及抓取滑脱等真实失败轨迹进行训练。实验数据证实,采用EVAC增广数据训练的策略模型,其任务成功率可提升高达29%。
为了建立具身世界模型的权威评估标准,智元推出了全球首个评测基准EWMBench。其核心评测能力体现在其三维度立体评估体系上。在场景一致性方面,EWMBench通过微调DINOv2模型,量化评估生成场景中物体、背景及视角的稳固性与真实度。在动作合理性方面,综合运用HSD、nDTW及动力学评分三项互补指标,精确评估动作轨迹的物理合理性与连贯性。在语义对齐与多样性方面,结合多模态大模型(MLLM)和CLIP技术,从全局指令理解、关键步骤语义准确性、逻辑合理性等多层次进行深度评估。 EWMBench拥有高价值的数据支撑。其构建基础是百万级开源真机数据集Agibot-World,覆盖了家居、工业、医疗三大核心应用场景。该基准包含10类典型机器人操作任务,涉及刚体、柔体、流体及关节物体等多种交互对象。同时,EWMBench集成了超过300个专项测试样本,其中30%专门针对低光照、部分遮挡等极具挑战性的场景 智元机器人构建的“EnerVerse X EVAC X EWMBench”技术三角已形成强大的闭环飞轮效应,随着EVAC框架与EWMBench基准的全面开源,智元机器人成功打通了具身智能领域“算法-评测”协同进化的关键路径。这不仅将大幅降低模型验证成本、充分释放真机数据的巨大潜力,更有力推动全球研发者共建高效、普适的具身智能新生态。
|
|||||||||||