微软AI机器人早期用户质疑其是否物有所值——《华尔街日报》
Tom Dotan
微软为其最畅销软件推出的新人工智能助手已由测试者试用超过六个月,他们的评价是:有用,但往往物非所值。
该公司希望借助Microsoft 365 Copilot——一个能嵌入Word、Outlook和Teams的人工智能升级版——创造数十年来最大的成功之一。它采用与OpenAI的ChatGPT相同的技术,可以根据自然语言提示总结电子邮件、生成文本和创建文档。
参与测试的公司表示,他们的员工一直吵着要试用该工具——至少一开始是这样。到目前为止,包括Excel和PowerPoint在内的软件的缺陷及其容易出错的倾向,让一些测试者犹豫是否值得为每人30美元的价格买单。
“我不会说我们已经准备好为公司里的每个用户花30美元,”网络硬件公司Juniper Networks的首席信息官莎伦·曼德尔(Sharon Mandell)说,该公司自11月以来一直在测试Copilot。
微软表示,用户的早期需求是前所未有的,测试它的公司已经发现它很有价值。该公司没有透露注册的具体情况。
该公司已经押注数十亿美元——最引人注目的是通过其对OpenAI的130亿美元投资——认为它可以引领人工智能的发展。其股价因人们相信这项技术将推动其收入飙升而上涨,使其成为全球最有价值的公司。周日,它四年来首次在超级碗(Super Bowl)上播放广告,将Copilot吹捧为可以帮助年轻人实现创业梦想的工具。
“Copilot必须成功,股票才能有起色,”RBC资本分析师Rishi Jaluria表示。
微软CEO萨提亚·纳德拉图片来源:Kin Cheung/美联社在微软最近的财报电话会上,Copilot被提及超过50次。首席执行官萨提亚·纳德拉将其比作工作场所个人电脑的普及。
“我们已经从谈论AI转向大规模应用AI,”他说。
微软早期的AI升级效果参差不齐。2022年,公司发布了GitHub Copilot,该工具通过AI帮助程序员更快编写代码。微软高管表示,这项起价每月10美元的功能已拥有130万订阅用户,较上一季度增长30%。
集成在必应搜索中的AI聊天机器人未能掀起波澜。尽管微软高调推出,但并未对谷歌的搜索市场份额造成显著影响。高管们曾预期若必应能追赶谷歌,可能带来数十亿美元新增收入,但近一年后,必应的市场份额增长不足1个百分点。
部分企业对全面采用AI技术持观望态度。波士顿咨询集团调查显示,虽然近90%的企业高管表示生成式AI是今年公司首要任务,但近三分之二认为该领域需至少两年才能超越炒作阶段。约70%的受访企业仅专注于小范围有限测试。
微软曾寄望于企业对使用人工智能的渴望能促使它们签订大规模合约。去年11月该助手全面开放时,企业需至少签约300份订阅。一位微软软件经销商表示,许多企业对未经验证的软件作出如此规模的承诺心存抵触。
微软表示确信该工具节省的时间与金钱值得其成本。图片来源:Jaap Arriens/Zuma Press上月微软放宽了最低要求,允许企业以小规模团队试用该软件。
微软声明,通过该工具节省的时间和资金完全值得投入。
去年11月微软对早期测试者的调研显示,77%的用户因该软件能提升工作效率而不愿放弃使用。会议纪要功能为每次会议节省约30分钟,AI辅助写作使用户起草初稿的时间缩短6分钟。
材料科学公司陶氏首席信息及数字官梅兰妮·卡尔玛表示,在约300人参与测试后,公司计划2024年底前向近半数员工推广Copilot。
“效率提升非常可观,“卡尔玛说。这家总部位于密歇根州米德兰的公司拥有约35,900名员工。
早期测试者向《华尔街日报》表示,微软职场通讯软件Teams的人工智能插件最为实用。
部分迟到会议的测试者已习惯依赖Copilot获取会议内容摘要。跨国跨时区工作者现在可选择跳过会议,直接阅读摘要。
联想集团首席信息官胡贯中表示:“它让人们能坦然说’反正有十个人在参会,我这次就不参加了。明早通过摘要快速浏览,直接跳转到需要关注的部分就行’"。
测试者也指出技术短板:包含生成式AI工具的Microsoft 365 Copilot有时会产生"幻觉”,即编造回答。用户反映会议摘要偶尔出错。
某广告公司案例显示,Copilot生成的会议摘要曾记录"Bob讨论了产品战略”。
该公司高管指出,实际参会者中既没有名为Bob的人,也无人讨论产品战略。
在数据处理类程序中,这种幻觉更成问题。测试者表示Excel是他们较少使用AI辅助的程序,因为数值计算可能出错。
微软职场应用副总裁贾里德·斯帕塔罗坦言,Excel功能尚处预览阶段,实用性落后于其他程序。
部分用户表示,微软此前宣传的其他功能,如Copilot生成PowerPoint幻灯片的能力,同样令人失望。
风投公司Andreessen Horowitz合伙人吉多·阿彭策勒在X平台发帖,展示了该功能在制作演示文稿时出现的错误。
“简直一团糟,根本谈不上创造价值,“阿彭策勒评价道。
宾夕法尼亚大学沃顿商学院人工智能教授伊森·莫里克在帖子中指出,Copilot在Outlook中为潜在会面推荐的时间段要么已被占用,要么安排在周六。
不过莫里克总体上给予该软件积极评价,称其为"一套相当令人印象深刻的工具”。
微软的斯帕塔罗表示,PowerPoint功能"仍在学习阶段”。
部分早期使用者称,对AI工具的最初热情迅速消退。联想集团表示,除用于Teams会议转录的AI外,大多数软件的Copilot使用量在一个月后下降约20%。
微软的斯帕塔罗称,公司计划通过增加提示和引导功能来解决使用率下降问题。
史蒂文·罗森布什对本文亦有贡献。
联系记者汤姆·多坦,邮箱:[email protected]