谷歌 DeepMind
公司简介
是谷歌旗下专注于人工智能研究的部门,由 DeepMind 和 Google Brain 于 2023 年合并而成。聚焦于通用人工智能(AGI)的研究,致力于开发能够理解和适应物理世界的智能系统,推动人工智能在医疗、科学、机器人等领域的应用。
代表成果
- Gemini Robotics:基于 Gemini 2.0 的视觉 - 语言 - 动作(VLA)模型,可直接控制机器人执行复杂任务,具备通用性、交互性和灵巧性。例如,机器人无需专门训练即可完成折纸、系鞋带等精细操作,还能理解自然语言指令并实时适应环境变化。
- Gemini Robotics-ER:专注于具身推理(Embodied Reasoning),增强机器人对空间和物理世界的理解能力。该模型可生成代码和规划动作轨迹,帮助机器人在复杂环境中安全执行任务,如抓取物体、规划路径等。
- Project Astra:概念 AI 助理,集成 Gemini 技术,通过摄像头和传感器理解物理环境,提供语音、视觉交互服务,如识别物体、解释代码、提醒物品位置等,体现了具身智能在人机交互中的应用。