谷歌将人工智能代理置于Gemini更新的中心 | 路透社

Kenrick Cai

2024-12-11

双子座标志在2024年5月20日的插图中可见。路透社/Dado Ruvic/插图/档案照片旧金山，12月11日 - 字母表的(GOOGL.O)谷歌在周三发布了其人工智能模型双子座的第二代，并暗示了一系列超越聊天机器人的新方式使用人工智能，包括通过一副眼镜。首席执行官桑达尔·皮查伊在一篇博客文章中称这一时刻为“新代理时代”的开始，指的是虚拟助手能够以更大的自主性执行任务。“它们可以更好地理解你周围的世界，提前考虑多个步骤，并在你的监督下代表你采取行动。”

这些发布强调了谷歌旨在重新夺回在主导新兴技术竞赛中的领先地位的方法。微软支持的(MSFT.O)开放人工智能在2022年11月发布聊天机器人ChatGPT时引起了全球关注。谷歌推出双子座于2023年12月，现在提供四个版本。周三，它发布了Flash的更新，这是其第二便宜的模型，具有改进的性能和新增的处理图像和音频的功能。其他模型将在明年推出。

OpenAI最近几天宣布了一系列新产品，以多样化其前景，包括一个每月200美元的ChatGPT订阅，用于高级研究使用，以及其文本转视频模型Sora的可用性。谷歌的策略是将其AI进展注入已经广泛采用的应用程序中。搜索、Android和YouTube是该公司表示每月有超过20亿人使用的七个产品之一。

这一用户基础是相较于挑战者初创公司如搜索初创公司Perplexity的显著优势，后者正在寻求90亿美元的估值，以及像OpenAI、Anthropic或埃隆·马斯克的xAI这样的新研究实验室。Gemini 2.0 Flash模型将为包括AI概述在内的应用程序提供支持。Alphabet最大的赌注是搜索的AI，首席投资官Ruth Porat在周二的路透社NEXT会议上表示。谷歌还向记者展示了Project Astra的新功能，这是一个原型通用代理，可以实时与用户讨论他们智能手机摄像头捕捉到的任何内容。该工具现在可以进行多语言混合的对话，并处理来自地图和图像识别工具Lens的信息，DeepMind集团产品经理徐碧波告诉记者。

而Astra也将在原型眼镜上进行测试，这是该公司自Google Glass失败以来首次重返该产品领域。其他公司也已进入市场，包括Meta，该公司在九月发布了一款AR眼镜原型。谷歌还向记者展示了Project Mariner，这是一个Chrome浏览器扩展，可以自动化按键和鼠标点击，类似于竞争对手实验室Anthropic的“计算机使用”功能，一个名为Jules的软件编码改进功能，以及一个帮助消费者做出决策的工具，比如在视频游戏中该做什么或购买哪些物品。路透社每日简报提供您开始一天所需的所有新闻。请在这里注册。

推荐主题：
人工智能