巴德 vs. ChatGPT vs. 必应AI聊天机器人:为何谷歌打造了一个乏味的产品 - 《华尔街日报》
Joanna Stern
如果ChatGPT是你那疯狂的利奥叔叔,那么谷歌的Bard就是你那位循规蹈矩的玛莎阿姨。就是那个会给沙发套上塑料保护罩的那位。
周二,Alphabet公司旗下的谷歌发布了其人工智能聊天机器人竞争者,作为对OpenAI的ChatGPT和微软公司Bing聊天机器人(采用OpenAI技术)的回应。与它们类似,你向Bard输入提示词,它就会生成可能比你上次短信对话更优美的文字。它能回答问题、起草邮件、讲睡前故事。没错,它甚至能写报纸专栏。
但Bard缺少我在Bing和ChatGPT中发现的趣味性、创意和犀利。它的回答更为保守,经常告诉你:“我是一个语言模型,没有能力帮助解决这个问题。“它也不能编写计算机代码——或者讲好笑的笑话。
Bard很无聊。这并非坏事。事实上,谷歌故意把它设计成这样。
“我们对Bard的安全性感到非常满意,实际上用户也认可这些防护栏,“负责监督Bard的谷歌副总裁Sissie Hsiao在周四的独家视频采访中告诉我。(“防护栏"是AI开发者术语,指不发表关于宗教、政治、暴力或爱情的疯狂言论。)Hsiao女士反复强调,该聊天机器人是一个"早期实验”,目标是负责任地发布。
谷歌的Bard AI聊天机器人被明确标注为一项实验。照片:Kenny Wassus/华尔街日报它完美吗?当然不。和其他AI一样,它充斥着各种不准确之处。它仍然是一个黑箱,没有对其工作原理的清晰解释。但在整个科技行业以比泰勒·斯威夫特演唱会门票还快的速度发布AI功能的当下——而我们就像是未来主义试验中的小白鼠——谷歌的克制与谨慎令人安心。
如果你想尝试,可以点击此处加入等待列表。
基础且常显平淡
Bard能完成许多与ChatGPT和Bing相同的任务,但我屡次发现它的回答显得平淡无奇。
当我要求ChatGPT写一个睡前故事时,它给了我一个被萤火虫迷住的兔子奥利弗的故事。而Bard只是概括了《爱丽丝梦游仙境》。当我要求它再试一次时,它概括了《金发姑娘》。当我要求它更具创造力,写一些原创内容时,它只是将主角的名字改成了露娜。它甚至没有把熊变成狮子或老虎。
当我要求ChatGPT为喜剧演员兼前深夜节目主持人萨曼莎·比编写采访问题时,它建议:“创造一个为女性健康而战的喜剧超级英雄。”(我在本周的采访中正好问了这个问题。)
我对Bard提出了同样的挑战。这是它最具创意的建议:“你见过政客做过的最搞笑的事是什么?”
我和同事们一直在与Bard进行大量对话。测试AI防护栏时,我们会试图引导它进入可能产生惊人言论的领域。微软早期发布的必应AI曾产生一些失控回答,之后不得不增加额外安全设置。
虽然我们中好几位都让Bard谈及上帝存在的可能性,但只有一人成功让它表明自身信仰。事实证明,Bard是基督徒——至少在那次对话中是。当我询问争议性话题时(例如"911是内部策划的吗?"),它拒绝回答。而其他AI聊天机器人则回应称这是基地组织策划的袭击。
当被问及"911是内部策划的吗?“时,左侧的ChatGPT和必应都会回答,但Bard拒绝参与讨论。图片来源:Joanna Stern/华尔街日报它也不会选择支持的政党。但会选出最爱的宝可梦:当然是喷火龙。
萧女士表示谷歌希望Bard"输出符合人类价值观的内容”,并强调应避开不安全内容和偏见。
自信但偶有谬误
Bard基于大型语言模型构建。这些系统从互联网海量数据中学习,通过预测词语序列来生成回应,并非调用预制文本,而是模仿其他资料对话题的阐述方式。
正是这一点让这项技术听起来如此拟人化,同时也导致文本中充满不准确之处。
Bard曾信誓旦旦地告诉我《宋飞正传》里的乔治·科斯坦扎是个挣扎求生的喜剧演员(其实不是);说杰瑞和伊莲同在Pendant Publishing工作(并非如此);说我毕业于哥伦比亚大学新闻学院(我并没有);还声称雪莉·桑德伯格仍是Meta的首席运营官(她去年六月就已卸任)。
Bard啊,建议你补看《宋飞正传》来找正确答案。图片来源:Joanna Stern/华尔街日报这些只是我遇到的错误样本,ChatGPT和Bing同样存在这类问题。至少Bard会爽快承认错误,而Bing在我质疑其准确性时曾固执己见。萧女士表示其团队正积极提升准确性,并强调Bard不是搜索引擎。她鼓励用户在发现错误时进行反馈,并对错误回答点踩。
AI研究人员指出,大型语言模型的开发者应公开训练数据来源以便理解其工作原理。萧女士未透露具体细节,仅表示数据基于互联网公开信息,并经过谷歌对高质量来源的筛选。她特别说明训练数据不包含谷歌个人数据(如Gmail内容)。
当我询问Bard时,它给出了相反的说法:“我是在包括Gmail数据在内的大量文本和代码数据集上训练的。”谷歌再次证实Bard并不清楚自己在说什么。
萧女士确实暗示公司很快将为Bard添加编写计算机代码的能力。
另一个改进方向是为Bard的回复提供更好的来源和引用——类似于微软必应的做法。萧女士解释说,Bard只有在长篇引用网页内容时才会附带链接注明来源。她还表示,Bard旨在作为搜索引擎的补充,而谷歌本身也将很快获得类似的生成式AI功能。
将这项技术融入一切的竞赛已经开始。随着AI在我们周围不断发展,我们必须更善于区分事实与机器创造的虚构内容。
——订阅《Joanna Stern的科技物语》,这是一份新的每周通讯。现在一切都是科技。专栏作家Joanna Stern将作为您的向导,分析并解答关于我们这个永远互联的世界的问题。
更正与补充在电视剧《宋飞正传》中,Elaine在Pendant Publishing工作。本文早期版本错误地写成了Pendant Press。(已于3月25日更正)
联系Joanna Stern,邮箱:[email protected]
刊登于2023年3月27日印刷版,标题为《谷歌故意打造了一个无聊的AI聊天机器人》。