谷歌推出机器人AI模型;与Meta、OpenAI竞争——彭博社
Julia Love, Davey Alba
Alphabet的人工智能实验室推出了两款新型机器人模型。这些模型旨在帮助开发者训练机器人应对异常场景,这一直是该领域的挑战。
谷歌DeepMind将推出Gemini Robotics,这是其旗舰人工智能模型的新分支,目标是开发更灵巧、更具交互性的机器人,周二宣布。另一款模型Gemini Robotics-ER专注于空间理解,将帮助机器人制造商开发利用Gemini逻辑能力的新程序。
谷歌位于加州山景城的总部。来源:彭博社DeepMind工程师Kanishka Rao在媒体简报中表示,通过将Gemini应用于机器人,谷歌更接近开发能承担多种任务的“通用机器人”。“我们的世界超级混乱、动态且丰富,我认为智能通用机器人必须能够应对这种混乱。”
硅谷建造能与人类平起平坐执行任务的机器人之梦再次吸引关注和投资。Meta Platforms、特斯拉和OpenAI加强了机器人研发,初创公司正洽谈以惊人估值融资。
在周二预先录制的演示中,谷歌研究人员展示了搭载其技术的机器人如何响应简单指令。一个站在字母积木前的机器人在训练师要求拼写单词时,说出了“Ace”。
工程师们还在实验室搭建了微型篮球场。当另一个机器人被要求完成扣篮动作时,它将一个小塑料球按进了篮筐。
“团队第一次看到机器人投篮成功时非常激动,“Rao表示,“因为该机器人从未接触过篮球相关事物。它通过Gemini获得了对篮球网的通用概念理解,明白‘灌篮’的含义,并能将这种理解转化为物理世界的实际动作。”
谷歌在机器人领域有着曲折的发展历程。十余年前,该公司收购了至少八家机器人公司,以推动联合创始人拉里·佩奇和谢尔盖·布林利用机器学习开发消费级机器人的目标。多年来,这些努力被整合到Alphabet的登月计划实验室Google X中,2021年还分拆出专注于垃圾分类等日常任务的Everyday Robots部门。约两年后,Alphabet宣布作为2023年全面预算削减计划的一部分将关闭该部门。
尽管如此,Alphabet从未完全退出机器人业务。当时该公司表示,会将部分技术和团队整合到现有的机器人项目中。现在,该公司似乎正以生成式AI为旗帜重新启动这些努力。
在简报会上,谷歌强调这项工作处于"早期探索阶段”。DeepMind研究员Vikas Sindhwani表示,Gemini模型在开发时具备"对物理环境中常识安全的深刻理解”。谷歌计划逐步部署机器人,最初与人类保持安全距离。随着安全性能的提升,它们将逐渐变得更加互动和协作。
谷歌宣布将与Apptronik等该领域企业共同探索Gemini的机器人能力,该公司已与其建立合作伙伴关系开发人形机器人。其他参与测试Gemini机器人ER模型的合作伙伴包括Agile Robots和Boston Dynamics——后者于2013年被Alphabet收购,后出售给软银。
原文标题:谷歌推出机器人AI模型,挑战Meta和OpenAI