新的亚马逊Alexa人工智能在实验室中停留,直到能够超越ChatGPT - 彭博社
Austin Carr, Matt Day
插图由731提供;照片:亚马逊
安迪·贾西不断向Alexa提出体育问题。那是2023年夏天,亚马逊公司的首席执行官想看看升级了人工智能的语音助手原型是否足够好,能够与OpenAI的AI聊天机器人ChatGPT竞争,后者在大约八个月前以其对话能力震惊了世界。
因此,贾西作为一名忠实的纽约巨人队足球迷和西雅图克拉肯冰球队的投资者,像ESPN记者在季后赛新闻发布会上那样审问Alexa——要求助手深入了解单个球员的表现、联赛排名、球队历史等等。Alexa在采访中表现得还不错,尽管它的回答远非完美:当贾西询问最近一场比赛的结果时,Alexa竟然编造了比分。
尽管如此,贾西似乎对亚马逊工程师如此迅速地交付一个半功能演示感到非常兴奋。参加演示的人回忆说,他大约说了30次“谢谢”。是的,新的改进版Alexa还需要更多的工作。但高管们相信,到2024年初可以实现一个测试版,并在不久之后进行广泛发布。
安迪·贾西在2021年西雅图的GeekWire峰会上。摄影师:大卫·赖德/彭博社然后时间表开始延迟。根据彭博社审查的内部文件,公司曾计划在10月17日举行一场盛大的活动,向贾西展示成品。亚马逊取消了这一计划,而是举行了一场较小的发布会,展示其Kindle电子书阅读器的新版本。一位熟悉此事的人表示,Alexa AI团队最近被告知,他们的目标截止日期已推迟到2025年。
亚马逊未能让高管接受采访,但表示其愿景仍然是将Alexa打造成为世界上最好的个人助手,并且生成性人工智能代表了改善服务的巨大机会。“我们已经将生成性人工智能整合到Alexa的不同组件中,并在努力大规模实施——在全球已有超过五亿个Alexa启用设备的家庭中——以便为我们的客户提供更主动、更个性化和更可信赖的帮助,”发言人Kristy Schmidt在一份电子邮件声明中说道。
自Jassy演示以来,Alexa的对话能力有所改善,但参与该项目的顶尖工程师和测试人员表示,这款增强人工智能的助手仍然会用无关或多余的信息喋喋不休,并且在以前擅长的平凡任务上,如开关灯,仍然表现不佳。
亚马逊发现自己处于这种境地,客观上令人震惊。十年前,Alexa定义了一个新兴的听觉硬件类别——智能音箱、电视、平板电脑、相机、汽车配件、微波炉——能够快速响应口头请求。
确实,对于许多人来说,Alexa不过是一个被美化的厨房计时器。尽管该公司曾估计超过四分之一的美国家庭拥有至少一个Alexa启用设备,但它并没有成为亚马逊预期的赚钱机器。但如果亚马逊能够利用这一覆盖面,并说服即使是其中一小部分客户为升级版的AlexaGPT付费,这个挣扎中的部门最终可能会盈利,并确保其在一个节俭的机构中的未来。如果亚马逊未能迎接挑战,Alexa可能会被视为消费电子历史上最大的失利之一,与微软的智能手机失误相提并论。
一些员工将Alexa的问题归咎于官僚主义和管理臃肿,而贾西一直试图消除这些问题。(在9月16日的公司-全员备忘录中,他批评了不必要的“决策会议的预备会议的预备会议。”)其他内部人士则谈到亚马逊的商业模式存在更深层次的问题,该模式历史上依赖于维持早期的领先地位,例如Prime、Kindle和贾西在2021年接替杰夫·贝索斯成为首席执行官之前运营了18年的亚马逊网络服务巨头。该公司还以迅速反弹而闻名,凭借自己的独立卖家市场超越eBay,或在流媒体视频领域与Netflix Inc.竞争。即使是Alexa也只是通过超越苹果公司的Siri而获胜。
当前和前员工表示,这次不同的是,贾西尚未传达出一个引人注目的AI驱动的Alexa愿景。这些人中的许多人表示,该项目仍需要大量修复,他们对最终产品能否与市场上已经存在的众多AI应用相媲美并不乐观。在没有通常的第一或第二移动优势的情况下,亚马逊最好的希望是能够推出第13个左右的ChatGPT变种。一位曾帮助改善公司电子商务引擎AI的前高级工程师表示,亚马逊人在贝索斯时代相信他们正在建立一家千年公司。现在,这位工程师表示,感觉亚马逊正在追赶。
Alexa的诞生源于贝索斯的一个蓝天请求:“打造一款20美元的设备,其大脑在云端,完全由你的声音控制。”这封邮件是在2011年写给他的产品领导者的,同年苹果推出了Siri,这一请求使研究人员踏上了一段奇怪的三年旅程,试图找出如何声学检测特定关键词(例如“Alexa”),以激活机器、识别语音模式并做出相应的回复。
贝索斯向股东推销Alexa时称其为“人工智能助手”,尽管它并不完全是“人工智能”,至少在当前的定义上不是。与ChatGPT、微软的Copilots和谷歌的Gemini等最先进的人工智能服务能够进行广泛的解读并生成无尽独特的响应相比,Alexa最初部分基于一种规则系统,该系统将答案逻辑性地映射到上下文相似的问题上。它无法即时写出一篇论文或分析一个棘手的微积分问题。但无论用户询问外面的天气如何、是否预计会下雨,还是是否需要带伞,Alexa都理解他们可能想要当天的天气预报。
贝索斯在2011年推出新的Kindle Fire平板电脑。同年,他向副手推销人工智能助手。摄影师:埃米尔·瓦姆斯特克/Bloomberg这种方法是提升Alexa智商的核心。由于其知识结构存储在互联网服务器上,亚马逊可以不断为其提供新的数据集和问答模板。最初训练这个虚拟助手涉及雇佣付费演员在测试扬声器中朗读台词并编写答案。
最终推出的180美元的亚马逊Echo是一个黑色圆柱形小工具,约与一个网球罐的高度相当,2014年底发布时引起了困惑的反应。评论家们从未见过类似的产品。然而,Alexa立即成为热门,部分原因在于其即时可用性:虽然Siri需要iPhone和按键才能使用,但Alexa在一个旨在客厅使用的独立设备中提供了免提助手。
不久,Echo的销量超过了一百万台,而负责Alexa软件的亚马逊设备部门正在计划大量低成本的替代品。这位以节俭著称的贝索斯如此看好,以至于他给予该部门(到2016年时拥有1000名员工)大量资源和自主权。一位前招聘经理表示,招聘人员被鼓励告诉在亚马逊其他部门获得工作机会的工程师,他们应该加入Alexa团队。“没有其他人在做这些,”当时亚马逊设备负责人戴夫·林普去年对彭博新闻说。“谷歌还没有发布任何产品。苹果也不在这个行业。”
消费者的体验是如此陌生,以至于亚马逊提供了奇特的说明,告诉用户如何与Alexa互动。例如,它建议用户让Alexa播放音乐、阅读新闻,甚至定义“生命的意义”。当然,Alexa实际上无法对后一个问题进行哲学讨论,这个问题是开玩笑的,但工程师可以编程让它做出一系列有趣的反应,从而赋予它个性。亚马逊表示,Alexa基于一种意图预测系统,结合深度学习和自动语言处理来改善服务。
维护和完善Alexa的问答库是极其劳动密集的。为了改善Alexa的语音识别,亚马逊雇佣了一支庞大的团队来转录误解的“发音”的音频记录,并手动教Alexa实际说了什么。与此同时,由一位名叫罗希特·普拉萨德的严肃科学家领导的机器学习团队,继续扩展到他们所称的新“领域”,以便Alexa能够召唤实时体育比分或在机顶盒上搜索电视节目。
罗希特·普拉萨德在2023年9月于阿灵顿的HQ2校园参加亚马逊设备和服务活动时发言。摄影师:阿尔·德拉戈/彭博社在接下来的几年里,林普急于占领语音市场的任何角落,将Alexa注入到一种几乎全是廉价硬件的随意分类中。床头的小音箱。语音启用的灯泡、时钟和烤箱。在Prime促销期间,一些Echo的售价低至14.99美元。2019年,林普甚至宣布推出带麦克风的眼镜和指环,以便在外出时与Alexa对话。尽管这些小玩意儿经常以成本价或亏损出售,但一种称为“下游影响”(Downstream Impact,DSI)的灵活指标为这些开支提供了合理性。客户购买的Alexa设备越多,预计该客户的DSI在未来就会因增加的购物收入(“Alexa,订购更多纸巾”)或Prime附加服务到音乐流媒体和家庭安全服务而上升。至少这是希望。
这种“意大利面条墙上扔”的硬件策略找到了立足点,帮助亚马逊销售超过1亿台Alexa设备。它也给各种软件工程团队带来了麻烦,这些团队不断被迫从长期产品路线图中脱离出来,为各种设备制作定制的礼宾功能和回答模板,三位了解情况的人士表示。更糟糕的是,Alexa的僵化思维要求在其伴随应用程序中进行烦人的手动配置,并为亚马逊在超级碗广告中宣传的更酷查询提供生硬的语音指令,例如直接从Echo拨打朋友的电话。
Alexa无处不在
亚马逊将语音助手放入从微波炉到时钟的所有设备中
来源:来自亚马逊及其品牌子公司的产品公告和列表汇编的数据。照片:亚马逊
虽然普拉萨德的团队确实构建了自动化Alexa学习的工具,但它们在越来越分隔的单元之间进行了大量的微调。一个单元从亚马逊几年前从一家专门聚合公共数据的初创公司收购的维基百科式“知识图谱”中提取答案。另一个则专注于从网络外包答案,等等,针对更具体的领域。Alexa的“大脑”本质上被切割成分散在全球各地亚马逊实验室的多个部分。这种孤立的工作反映在Alexa的响应中:四位熟悉后端流程的人表示,每当提出问题时,Alexa会生成一堆不同的竞争答案,并在瞬间传达出一个由内部评分驱动的答案,该答案被认为是最相关的。
财务资源和人员数量在一定程度上取决于这些大脑的哪些部分——以及开发它们的团队——提供了更高比例的答案,这是一场适者生存的竞争。一位前Alexa高管表示,一些单元会每周密切跟踪领域流量数据,以确保他们的表现不落后于竞争对手,避免被淘汰。这种资源争夺造成了混乱,这个人说,促使在一个已经以激烈竞争著称的文化中产生了激烈的竞争。目前尚不清楚这种设置是否对客户有利,还是仅仅对胜利的产品领地有利。亚马逊表示,它投资于提供最大客户利益的领域,并且其团队并不以这种方式竞争。该公司还表示,在分配资源时考虑的因素远不止领域响应量。
到2020年,Alexa的高层开始质疑Alexa的DSI指标的准确性,这些指标并没有将软件变成纸面上承诺的盈利业务。尽管该部门拥有约10,000名员工,但这些设备的售价仍然只能让亚马逊实现收支平衡,而产生数字收入的尝试也失败了。Alexa的互动对于更高级的应用来说实在太笨拙。即使它增加了对第三方开发者的支持,用户可以下载“技能”以获得定制的语音体验(瑜伽课程、烹饪食谱、危险边缘问答等),大多数也只是花招而且是免费的。
亚马逊自己的收入努力也失败了。Alexa的一个核心承诺——它将鼓励消费者用声音购物——从未流行开来。公司表示,超过一半的Echo用户曾使用这些设备购物,但Alexa的老手警告说,这些统计数据包括了像制作购物清单这样的步骤。员工表示,随着世界在Covid-19大流行后重新开放,对DSI的审查加剧,而当购物者回到商店时,亚马逊的销售增长放缓。根据两位熟悉此事的人士,贾西仔细审查了设备业务的财务健康状况,并对Alexa的指标进行了仔细审视。即使与影响亚马逊其他业务的更大顺风因素隔离,它们仍然令人非常失望。(《华尔街日报》在今年早些时候报道了贾西的财务审查。亚马逊表示,Alexa面前的机会大于目前在任何资产负债表上所显示的,并且贾西相信他的团队在长期业务潜力和创造力方面。)事情需要改变。
在西雅图的一家亚马逊生鲜超市内的Alexa自助服务亭。Alexa未能让人们在家购物。摄影师:大卫·赖德/彭博社2022年11月30日,ChatGPT颠覆了游戏。OpenAI的聊天机器人使用大型语言模型——这些系统被输入大量数据,包括书籍、文章和在线评论——以提供用户查询的最佳响应。这种新架构与Alexa的截然不同,更加智能,具有惊人的对话能力和创造性解决问题的能力。它能够处理自然对话,甚至可以在没有预加载响应的情况下,哲学性地讨论生命的意义。突然间,亚马逊感到在人工智能助手方面落后了好几年。
值得注意的是,OpenAI的发布并没有像谷歌那样引发“红色警报”时刻,谷歌的高管们立即组织团队专注于生成性人工智能,意识到对其旗舰搜索引擎的生存威胁。如果说有什么不同,亚马逊内部人士表示,反而对这一人工智能飞跃可能对Alexa业务的意义感到巨大兴奋。然而,就在两周前,亚马逊宣布裁员数千人,许多裁员针对的是亏损的设备和服务部门。贾西告诉员工,在经济不确定性面前,他将冻结新的招聘。他们必须以更少的资源做更多的事情。
然后ChatGPT迅速走红——在几个月内达到了1亿活跃用户——OpenAI在2023年2月推出了每月20美元的高级订阅。亚马逊内部对Alexa的重大升级变得更加紧迫。这并不是亚马逊第一次尝试开发对话模拟器。2020年,该公司推出了一项名为“Alexa Conversations”的功能,以便能够进行闲聊,比如电影推荐,而不仅仅是提供从附属网站IMDB.com抓取的数据。但它仍然是基于模板和可能答案的库。
亚马逊表示,它在这个时候开始将早期的大型语言模型(LLM)纳入Alexa,包括一个名为“Alexa教师模型”的模型,该模型于2021年部署,以增强其学习能力。工程师们还在尝试在Alexa现有数据库上叠加相对原始的模型,寻找使助手更具对话能力的方法。但根据三位熟悉开发的人士的说法,这项工作并不是优先事项,Alexa团队的许多人甚至对这种调整毫不知情。一位前Alexa产品负责人表示,他们直到ChatGPT推出后才听说过大型语言模型。
ChatGPT在几个月内达到了1亿活跃用户。摄影师:安德烈·鲁达科夫/彭博社当亚马逊着手开发一个可比的LLM时,如何将Alexa的“大脑”迁移到这个框架上成了一大难题。一些员工打趣说,Alexa与自动电话树的相似之处多于与人工智能的相似之处。转向预训练的AI模型意味着Alexa可以独立处理无限复杂的问题,但也有可能在基本任务上变得不那么可靠,例如设置厨房计时器或从接入的数据库中获取一次性答案。例如,当贾西在2023年夏天测试Alexa AI原型时,由于它连接的是一个通用语言模型,而不是实时体育信息,因此无法即时提供准确的足球比分。其他为贾西构建AI演示的团队则尝试了Meta Platforms Inc.的Llama模型,这些模型比亚马逊的更先进。
Prasad的团队从Limp的设备部门分离出来,因此它直接向Jassy报告,不再受制于硬件战略。(Limp已经离开,负责贝索斯的蓝色起源太空项目。)Alexa团队被赋予了广泛的任务,构建可以被其他亚马逊团队使用的基础模型,以及可以被云部门转售的模型。其雄心的规模通过团队的新名称得以明确:人工通用智能。
他们的工作在2023年9月亚马逊位于弗吉尼亚州阿灵顿的大型新办公大楼的产品发布会上揭晓。一次现场对话,使用Jassy私下测试过的同款Echo Show模型,展示了Alexa如何轻松地聊起海鹰队的表现、下一场比赛,推荐烧烤菜单,并制作邀请函发送给朋友。“感觉就像在和一个人交谈,”自信的Prasad在台上说道。为了在向公众推出之前获得这种新模式的访问权限,用户需要告诉Alexa“我们聊聊”,它最终会通知他们何时可以体验。
媒体反应积极,但在亚马逊内部,越来越明显的是,2024年初推出的可能性不大。Alexa的响应时间可能很慢,并且在处理AI幻觉方面遇到了问题。参与该项目的两位人士表示,测试用户的满意度评分很低——响应听起来僵硬,并不是很有用——而且Alexa现在在一些智能家居集成方面出现了问题。新的AI架构有时也会过度思考查询,这让听众感到恼火。前Alexa高管表示,这就像询问当天的温度,而AI回答“81.0583°。”
普拉萨德,通常是一个穿着整齐、做事有条理的人,在每周的进展会议上表现出紧张的迹象。一位长期合作伙伴表示,优先事项从关于Alexa未来的连贯愿景的审慎讨论转变为迫使他的下属尽快实施新的AI功能。此人表示,他们从未见过普拉萨德如此紧张,并且指导意见通常是“赶快发布”。亚马逊表示,在普拉萨德的领导下,Alexa团队在语音和语言技术方面开创了突破性的进展,并且他是实现公司AI愿景的合适领导者。
近年来,Alexa的AI内部测试人员发现其表现远不如ChatGPT。这些人仍然会审查转录以改进Alexa,尽管他们的培训现在是多方面的。与简单的问答脚本不同,他们现在正在审查Alexa直觉的多个层面,检查其对问题的观察和回应思路,以及答案的质量。对话数据在电子表格中进行跟踪。
从技术上讲,它更聪明,但不一定更明智。一位测试人员表示,持续的幻觉并不总是错误的,只是没有必要,就像Alexa试图展示其新获得的能力。例如,以前,如果你问Alexa贾斯汀·汀布莱克和珍妮特·杰克逊在什么活动中表演了中场秀,它可能会说是2004年超级碗。现在,它同样可能会给出关于臭名昭著的衣物故障的冗长补充。
另一位测试专家表示,一些提议的查询——例如要求Alexa帮助撰写求职信或调试计算机代码——完全不适合语音助手。这些查询需要键盘和屏幕,而不是免提的Echo。专家猜测这些请求可能来自一个基于应用程序的Alexa版本,可以输入问题,而不仅仅是口头提问。无论如何,这位测试人员被指示将回复控制在30秒或更短,以免让用户感到沮丧。结果就像在评分糟糕的论文,这个人说。
在某些方面,Alexa 追赶 ChatGPT 的最大机会——消费者手中的数百万设备——也是其最大的负担。玩弄 ChatGPT 的用户期望它会犯错误。如果亚马逊启动其 LLM 大脑,Alexa 开始喷出挑衅性的回答,这可能会给 Jassy 带来灾难,因为使用 Echo 硬件的孩子和家庭占了很大一部分。
虽然亚马逊一直在开发其 LLM,但一位前 AI 工程师表示,Alexa 团队最近一直依赖于来自法国 Mistral AI 和位于旧金山的初创公司 Anthropic 的模型,亚马逊在其中投资了 40 亿美元。(亚马逊表示,没有单一模型适用于所有用例,其团队利用通过 AWS 提供的多个 LLM。)Jassy 还挖来了微软公司产品负责人 Panos Panay,他曾主导软件制造商的 Windows 硬件和 Surface 笔记本电脑系列,接管亚马逊的设备团队。根据两位熟悉他计划的人士,他为一个擅长实用小工具的团队带来了更高质量设计的关注。
Panos Panay,当时是微软公司的首席产品官,在 2019 年纽约的一次产品活动上。亚马逊去年招募了 Panay。摄影师:Mark Kauzlarich/Bloomberg即使 Jassy 推动亚马逊的工程师迅速将生成 AI 融入更多产品,他也在内部和外部表示,这项技术仍处于早期阶段。竞争格局仍在变化。西雅图的高管们看到,早期将 LLM 驱动的助手与个人设备结合的努力,包括 Humane Inc. 和 Rabbit Inc.,都以失败告终。苹果公司,和亚马逊一样,并不被视为消费 AI 的领导者,最近才开始将这项技术的元素融入其 iOS 移动平台。更新版的 Siri 可能要到明年才会推出。在此期间,即使新版本的销售在这个假日季节较为疲软,iPhone 也不会消失。
但亚马逊的领导者们意识到,如果有更好的产品出现,人们可能会迅速拔掉Echo,因此他们明白自己可能只有一次机会将Alexa重新介绍给世界,三位接近公司的人士表示。因此,他们暂时按兵不动。自2017年以来,通常用于新Alexa公告的九月份首次过去,却没有重大揭示。相反,潘奈在下个月主持了一场新闻发布会,谈到了亚马逊更新的Kindle系列。
与此同时,去年秋天请求“让我们聊天”功能的消费者仍在等待与新Alexa AI在他们的Echo上对话。公司此后停止邀请选择升级的用户,而是建议他们坚持使用基本功能。“你可以问我问题或让我做一些事情,比如设置计时器、播放音乐、打开连接的灯等,”当被问及聊天时,Alexa现在这样回应。