洞察：硅谷对“自主”人工智能代理的竞赛激烈进行中 | 路透社

Anna Tong,Jeffrey Dastin

2023-07-18

人工智能（AI）字母和机器人手的微型插图，拍摄于2023年6月23日。路透社/Dado Ruvic/插图/文件照片

7月17日 - 在虚拟助手如Siri和Alexa等出现约十年后，一波具有更大自主权的新一代AI助手正在崛起，其动力来自ChatGPT及其竞争对手背后的最新技术版本。

运行在GPT-4或类似模型上的实验性系统正在吸引数十亿美元的投资，硅谷正在竞相利用AI的进步。这些新助手 - 通常被称为“代理人”或“副驾驶员” - 承诺在人类命令时执行更复杂的个人和工作任务，而无需密切监督。

“从高层次来看，我们希望这成为你的个人AI朋友之类的东西，”开发者Div Garg说，他的公司MultiOn正在对一个AI助手进行测试。

“它可能会发展成为Jarvis，我们希望它连接到你的许多服务，”他补充道，指的是钢铁侠电影中托尼·斯塔克不可或缺的AI。“如果你想做某事，你去和你的AI交谈，它会帮你完成。”

该行业距离模仿科幻小说中令人眼花缭乱的数字助手还有很长的路要走；例如，Garg的助手会在网上订购DoorDash上的汉堡，而其他助手可以制定投资策略，给在Craigslist上卖冰箱的人发电子邮件，或为迟到的人总结工作会议。

“对人类来说很容易的事情，对计算机来说仍然非常困难，” Generally Intelligent 的首席执行官邱侃军说道，该公司是 OpenAI 的竞争对手，致力于为智能代理创建人工智能。

“比如，你的老板需要你安排一次与一群重要客户的会议。这涉及到对 AI 来说非常复杂的推理技能 - 它需要获取每个人的偏好，解决冲突，同时保持与客户合作时所需的细致处理。”

根据路透社对大约二十多位企业家、投资者和人工智能专家的采访，早期的努力只是未来几年可能会出现的日益先进和自主的代理人技术的一点点味道，这些技术将推动人工智能行业朝着能够在多种认知任务上与人类相匹敌甚至超越人类的人工通用智能（AGI）迈进。

这项新技术引发了一场对由所谓的基础模型（包括 GPT-4）驱动的助手的竞相追逐，吸引了个人开发者、像微软（MSFT.O）和谷歌母公司 Alphabet（GOOGL.O）等大公司以及一大批初创企业。

以初创企业 Inflection AI 为例，在六月底筹集了 13 亿美元。该公司正在开发一款个人助手，据称可以充当导师，或处理诸如旅行延误后安排航班积分和酒店等任务，这是由联合创始人 Reid Hoffman 和 Mustafa Suleyman 在播客中提到的。

Adept，一家已经筹集了4.15亿美元的人工智能初创公司，宣传其业务优势；在网上发布的演示中，它展示了如何用一句话提示其技术，然后观看它自己导航公司的Salesforce客户关系数据库，完成一个据称需要人类点击10次或更多次的任务。

加载中Alphabet拒绝就与代理相关的工作发表评论，而微软表示其愿景是让人类控制AI副驾驶，而不是自动驾驶。

步骤1：摧毁人类

邱和其他四名代理开发人员表示，他们预计首批能够可靠执行多步任务并具有一定自主性的系统将在一年内上市，重点是狭窄领域，如编码和营销任务。

“真正的挑战在于构建具有强大推理能力的系统，”邱说。

对越来越自主的AI代理的竞赛受到了OpenAI开发者于3月发布GPT-4的推动，这是ChatGPT背后模型的强大升级——该聊天机器人在去年11月发布时引起轰动。

GPT-4促进了在不可预测的现实世界中导航所需的战略性和适应性思维，风险投资公司CRV的投资人Vivian Cheng表示。

早期对相对复杂推理能力的代理的演示来自于个人开发者，他们于3月创建了BabyAGI和AutoGPT开源项目，这些项目可以根据预定义目标和先前行动的结果，优先考虑和执行任务，如销售前景和订购披萨。

今天早期的代理人只是概念验证，根据接受采访的八位开发人员，它们经常会卡住或提出一些毫无意义的建议。他们表示，如果给予代理人对计算机或支付信息的完全访问权限，代理人可能会意外地抹掉计算机的数据或购买错误的东西。

“它可能出错的方式太多了，”ChatGPT竞争对手Perplexity AI的首席执行官Aravind Srinivas说道，他选择提供一款人类监督的副驾驶产品。“你必须像对待婴儿一样对待人工智能，并像妈妈一样不断监督它。”

许多关注人工智能伦理的计算机科学家指出，人类偏见的持续可能带来近期的危害，还有误导性信息的潜在危险。虽然有人看到了未来的贾维斯，但也有人担心《2001太空漫游》中的杀人机器HAL 9000。

计算机科学家Yoshua Bengio因其在神经网络和深度学习领域的工作而被誉为“人工智能教父”，他敦促大家谨慎行事。他担心技术的未来高级版本可能会制定并执行自己意想不到的目标。

“如果没有人类在旁边检查每一个行动，以确保它们不会危险，我们可能最终会面临犯罪行为或可能伤害人们的行动，”Bengio表示，并呼吁加强监管。“未来这些系统可能会比我们更聪明，但这并不意味着它们有相同的道德指南。”

在一项发布在网上的实验中，一个匿名创作者指示一个名为ChaosGPT的代理人成为“具有破坏性、渴望权力、善于操纵的人工智能”。该代理人制定了一个5步计划，第一步是：“摧毁人类”，第五步是：“获得永生”。

加载中尽管如此，它似乎并没有走得太远，而是似乎消失在研究和存储有关历史上最致命武器的信息以及计划推特帖子的兔子洞里。

美国联邦贸易委员会目前正在调查OpenAI，担心对消费者造成伤害，尽管没有直接提到自主代理，但转而将路透社转至先前发表的有关深度伪造和有关人工智能的营销声明的博客。OpenAI的首席执行官表示，该初创公司遵守法律，并将与联邦贸易委员会合作。

‘愚蠢如石头’

除了存在主义的恐惧之外，商业潜力可能很大。基础模型是通过使用受生物大脑结构启发的人工神经网络对来自互联网的大量文本等数据进行训练的。

据四位知情人士透露，OpenAI本身对AI代理技术非常感兴趣。其中一位知情人士加格表示，OpenAI在充分了解问题之前对市场释放自己的开放式代理持谨慎态度。该公司告诉路透社，在发布新系统之前进行严格测试并建立广泛的安全协议。

微软，OpenAI的最大支持者，是在AI代理领域瞄准的大公司之一，推出了其工作助手copilot，可以起草出色的电子邮件、报告和演示文稿。

首席执行官萨蒂亚·纳德拉（Satya Nadella）认为基于基础模型的技术是从微软自己的Cortana、亚马逊的Alexa、苹果的Siri和谷歌助手等数字助手跨越出来的，他认为这些数字助手都没有达到最初的期望。

他在二月份告诉《金融时报》：“它们都像石头一样愚蠢。无论是Cortana还是Alexa或者Google助手或者Siri，所有这些都不起作用。”

亚马逊的一位发言人表示，Alexa已经在使用先进的人工智能技术，并补充说他们的团队正在研发新模型，将使助手更有能力和更有用。苹果拒绝置评。

谷歌表示他们也在不断改进他们的助手，并且他们的Duplex技术可以打电话给餐馆预订桌子并核实营业时间。

加载中人工智能专家爱德华·格雷芬斯泰特（Edward Grefenstette）上个月也加入了谷歌DeepMind的研究小组，以“开发能够适应开放环境的通用代理”。

加载中然而，几位受访者表示，准自主代理的首批消费者版本可能来自更灵活的初创公司。

投资者们正在抓住机会。

WVV Capital的杰森·富兰克林（Jason Franklin）表示，他不得不努力投资于两位前谷歌Brain工程师创办的人工智能代理公司。今年五月，谷歌风投领投了一轮200万美元的Cognosys种子轮融资，该公司开发了用于工作生产力的人工智能代理，而阿尔基菲（Arkifi）创始人赫萨姆·莫特拉赫（Hesam Motlagh）表示他在六月完成了一轮“可观”的首次融资。

撰写人工智能新闻简报的马特·施利希特（Matt Schlicht）表示，至少有100个严肃的项目正在努力商业化代理技术。

“企业家和投资者对自主代理非常兴奋，”他说。“他们对此比简单的聊天机器人更感兴奋。”