谷歌(GOOGL)推出搭载Gemini技术的新型机器人AI模型——彭博社
Julia Love, Davey Alba
Alphabet公司旗下人工智能实验室推出两款专注于机器人技术的新模型,将帮助开发者训练机器人应对陌生场景——这是该领域长期存在的挑战。
研究部门Google DeepMind周二宣布将发布Gemini Robotics,这是其旗舰AI模型的新分支,旨在开发更灵活、更具交互性的机器人。另一款模型Gemini Robotics-ER专攻空间理解能力,将借助Gemini的推理功能帮助机器人制造商开发新程序。
DeepMind工程师Kanishka Rao在媒体简报会上表示,通过将Gemini应用于机器人,谷歌正朝着开发能处理多种任务的"通用机器人"迈进。“我们的世界极其混乱、动态且复杂,我认为通用智能机器人需要能够应对这种混乱。”
延伸阅读:Meta计划重金投资AI驱动的人形机器人
硅谷打造与人类能力相当的机器人之梦正重新获得关注和投资。Meta Platforms公司、特斯拉公司和OpenAI已加强机器人研发工作,初创企业正以天价估值洽谈融资。
在周二预先录制的演示中,谷歌研究人员展示了搭载其技术的机器人如何响应简单指令。一个站在字母积木前的机器人在训练师要求拼写单词后,拼出了"Ace"。
工程师们还在实验室里搭建了一个迷你玩具篮球场。当另一个机器人被要求完成扣篮动作时,它将一个小塑料球压进了篮筐。
“团队第一次看到机器人扣篮时非常兴奋,“Rao表示,“因为这台机器人从未接触过任何与篮球相关的事物。它通过Gemini理解了篮球网的外观和’slam dunk’这个词的含义,并将这些概念与现实世界中的任务联系起来。”
谷歌在机器人领域的发展历程颇为曲折。十多年前,该公司收购了至少八家机器人公司,旨在联合创始人拉里·佩奇和谢尔盖·布林的愿景——借助机器学习开发面向消费者的机器人。经过多年发展,这些努力最终整合到Google X(Alphabet的登月实验室),并于2021年分拆出Everyday Robots部门,专注于开发执行垃圾分类等日常任务的机器人。约两年后,Alphabet宣布作为2023年全面预算削减计划的一部分,将关闭该部门。
不过Alphabet从未完全退出机器人业务。当时公司表示会将部分技术和团队整合到现有机器人项目中。如今,该公司似乎正以生成式AI为旗帜重启这些计划。
在简报会上,谷歌强调这项工作处于"早期探索"阶段。DeepMind研究科学家Vikas Sindhwani表示,Gemini模型在开发时已具备"对物理环境常识性安全的深刻理解”。他称谷歌计划逐步部署这些机器人,初期将与人类保持安全距离,随着安全性能提升,未来将实现更多互动协作。
谷歌表示将开始与包括Apptronik在内的该领域企业共同探索Gemini的机器人能力,双方正合作开发人形机器人。其他正在测试其Gemini Robotics-ER模型的合作伙伴还包括Agile Robots和波士顿动力公司——后者于2013年被Alphabet收购,后又被出售给软银集团