课程简介
具身智能(Embodied Intelligence)强调智能体需通过与物理环境的交互获取感知和行动能力,近年来成为人工智能研究前沿。其发展路径可从视觉-语言-动作(VLA)系统(集中示例为两指夹爪)到高自由度灵巧手操作呈现明显演进。早期VLA研究聚焦于使智能体理解视觉信息并通过语言指令执行简单动作,如RT-1、RT-2等模型实现了基本视觉理解与机械臂控制。随着大模型技术发展,如PaLM-E、RT-X等多模态模型能够整合视觉、语言与动作表征,大幅提升了场景理解与策略生成能力。
高自由度灵巧手研究标志着具身智能迈向更复杂操作。Dexterous Hands项目展示了多指协同操作能力,而强化学习方法使得复杂抓取动作成为可能。最新研究实现了视觉引导下的精细操作,通过视觉-触觉多模态感知实现了如开瓶盖、折纸等复杂任务。当前挑战主要包括:物理交互的精确建模、现实与仿真之间的差距(Sim2Real Gap)、以及长序列复杂任务规划。未来研究方向指向多传感器融合、自监督学习与大模型驱动的任务分解能力,以实现更接近人类水平的灵巧操作
本次分享主要围绕高自由度灵巧手的实现,sim2real gap, 灵巧手操作模型,结合具身智能的进一步发展,共同为大家展现AI原生技术架构与具身智能技术逻辑,为大家带来进一步借鉴。
课程收益
1、帮助学员掌握高自由度灵巧手在具身智能中的创新应用与实现路径;
2、帮助学员破解Sim2Real技术瓶颈,提升具身模型在真实环境中的泛化能力;
3、帮助学员构建可泛化的具身操作体系,赋能未来智能体多任务处理能力
受众人群
具身智能算法工程师、AI原生应用架构师、 机器人系统研发工程师、自动驾驶算法工程师、智能体(Agent)开发工程师以及其他对具身智能感兴趣的人员
课程周期
0.5天(3H)
课程大纲
1、AI与物理世界的鸿沟:具身智能的时代机遇
2、AI原生技术架构:算法驱动的软硬一体化创新
3、 核心AI算法:多模态感知与智能决策模型
4、开放生态建设:技术平台化的产业价值
5、 产业应用落地:智能制造的技术实践
6、下一代产品路线:技术展望与产业协作、以及构建人机共融的智能未来
7、QA
京ICP备2022035414号-1