谷歌将人工智能代理置于Gemini更新的核心 | 路透社

Kenrick Cai

2024-12-12

旧金山，美国，12月11日 - 谷歌(GOOGL.O)在本周三推出了其人工智能模型Gemini的第二代，并展示了一系列使用人工智能的新方式，超越了聊天机器人，包括通过眼镜。谷歌母公司Alphabet的首席执行官桑达尔·皮查伊表示，这一时刻标志着“代理的新纪元”的开始，指的是能够更自主地执行任务的数字助理。

“他们可以更好地理解周围的世界，提前考虑多个步骤，并在您的监督下代表您行动，”这位高管说道。

这些发布突显了谷歌正在努力恢复在人工智能市场主导地位的方式。由微软支持的OpenAI(MSFT.O)在2022年11月推出聊天机器人ChatGPT时引起了全球关注。谷歌在2023年12月推出了Gemini，并现在提供该系统的四个版本。谷歌在本周三推出了Flash的更新，这是其第二款更便宜的模型，具有增强的性能和处理图像和音频的额外功能。其他模型将在明年推出。

在过去几天，OpenAI宣布了一系列新产品，以多样化其业务，包括每月200美元的ChatGPT订阅，用于高级研究，以及其文本转视频模型Sora的可用性。

谷歌的战略涉及将其在人工智能方面的进展注入已经广泛采用的应用程序中。搜索、Android和YouTube是该公司表示每月有超过20亿人使用的七个产品之一。

这一用户基础相较于像Perplexity这样的初创公司是一个显著的优势，后者正在寻求与投资者进行90亿美元的估值，以及像OpenAI、Anthropic或埃隆·马斯克的xAI这样的新研究实验室。

Gemini 2.0 Flash模型将为包括AI概述在其搜索引擎中的应用程序提供支持。

Alphabet最大的赌注是用于搜索的人工智能，首席财务官兼投资总监Ruth Porat在周二于纽约举行的路透社NEXT会议上表示。

谷歌还向记者展示了Project Astra的新功能，这是一个可以实时与用户就其智能手机摄像头捕捉到的任何内容进行对话的通用代理原型。

该工具现在可以在多种语言的混合中进行口头对话，并处理来自地图和图像识别工具Lens的信息，DeepMind团队的产品经理Bibo Xu表示。

Astra还将在眼镜原型中进行测试，这是该公司自谷歌眼镜失败以来首次重返这一产品领域。自那时以来，其他公司也进入了市场，包括Meta，该公司在9月展示了一个增强现实眼镜的原型。

谷歌还透露了Project Mariner，这是一个Chrome浏览器的扩展，可以自动化键盘输入和鼠标点击，类似于Anthropic的“计算机使用”功能。该公司还推出了一种名为Jules的软件编码增强功能，以及一种帮助用户做出决策的工具，例如在视频游戏中该做什么或购买哪些物品。

((翻译编辑圣保罗, 55 11 56447753))

路透社 AAJ

建议主题：
科技