亚马逊上误导性的人工智能产品评论在假期季节让卖家感到恐慌-彭博社
Spencer Soper
一小部分评论称宾网网球有异味,这些评论被包含在一个由人工智能生成的摘要中。
图片说明:731;来源:亚马逊,盖蒂图片
在亚马逊网站上购物长期以来一直意味着要滚动浏览大量重复的客户反馈。为了让这项任务变得不那么繁重,该公司于8月开始使用人工智能将数十亿条评论转换成由几句话组成的简要摘要。
像许多生成式人工智能一样,结果并不完美。在某些情况下,摘要提供了对产品不准确的描述。在其他情况下,它们夸大了负面反馈。这不仅对顾客有潜在影响,也对依赖积极评价来提高销售额的亚马逊商家有影响。商家表示,更糟糕的是,这些摘要是在他们正值关键的假日购物季之际部署的,这让他们除了担心受通货膨胀影响的购物者外,还多了一件事要担心。
“如果你有少数负面反馈,而人工智能模型将其总结为一致的主题,那是不公平的,”经营亚马逊卖家咨询公司Black Label Advisor的乔恩·埃尔德说。“很难捕捉到这一点的经济影响,但卖家并不高兴。”
大多数购物者可能能够分辨出人工智能错误分类了产品的情况。例如,家庭健身公司Teeter销售一款旨在缓解背部疼痛的倒立桌。亚马逊的人工智能生成的摘要将其称为一张桌子:“顾客喜欢这张桌子的坚固性、可调性和缓解疼痛的功能。”
技术倾向于在一些评论中夸大负面情绪的倾向并不明显。例如,售价70美元的《黄铜伯明翰》桌游以来自500多名购物者的反馈为基础,拥有4.7星的评分。一个由三句话组成的AI评论总结以“然而,一些顾客对使用的便利性持有不同意见”结尾。只有四条评论提到了使用的便利性,而且这些评论中只有少于1%被解释为批评性意见。然而,AI生成的评论总结中,负面情绪占了大约三分之一。
对宾网网球的总结称一些评论者对产品的气味感到失望。售价4美元的3个网球装以来自4300多名评论者的评价为基础,拥有4.7星的评分,但只有七条评论提到了气味。亚马逊将总结分解成了几个按钮,包括“质量”、“价值”和“气味”。购物者需要点击“气味”按钮才能发现有多少评论者抱怨了气味。
宾网网球的AI生成总结。来源:亚马逊彭博社对数十个评论总结进行的审查发现,AI在分析顾客评论并生成评论总结时并不一致。有些评论突出了批评性的反馈,而其他评论则没有。一个8个装的玻璃罐拥有4.5星的评分,基于3000多条评价。AI生成的总结称:“然而,一些顾客报告了锈蚀盖的问题。”购物者必须深入产品页面才能看到只有16名顾客抱怨了锈蚀。与此同时,一个基于21315条评价拥有4.7星评分的背包的评论写作中并没有提到廉价的肩带,尽管有900多名顾客抱怨了这一点。
“我们的分析发现,评论亮点帮助客户找到他们想要的产品,并导致卖家的销售额增加,”亚马逊发言人在一份电子邮件声明中说道。“我们非常关心准确性,我们将不断改进评论亮点的体验。虽然我们几乎没有听到关于这一新功能的担忧,但卖家可以随时联系卖家支持部门,如果他们对产品的评论亮点有疑问。”亚马逊表示,将根据购物者和商家的反馈不断改进这项技术。
产品评论几乎已经成为亚马逊购物的核心部分近三十年,提供口碑推荐,增强了那些否则可能因仅仅基于照片和营销描述而对购买某物感到犹豫的人的信心。根据该公司的数据,2022年,有1.5亿亚马逊客户留下了15亿条评论和评分。
自从ChatGPT去年让世界大吃一惊以来,公司们一直在争相部署生成式人工智能,这种人工智能可以挖掘大量数据来生成文本或图像。亚马逊已经开发了自己的版本,并将其用于总结数十亿条客户评论对于该公司来说是理所当然的。
“我们希望让客户更容易地了解评论中的共同主题,而随着生成式人工智能的最新进展,我们相信我们有技术手段来满足这个长期以来的客户需求,”亚马逊软件和产品总监沃恩·谢默霍恩在八月份的一篇博客文章中写道。
亚马逊的人工智能生成的评论摘要几乎肯定会随着时间的推移而改进,但对商家来说,这对他们现在来说几乎没有什么安慰。他们表示,多年来,亚马逊推出新工具和技术时很少提前警告或征求意见。卖家们说他们无法了解算法的工作原理,并表示亚马逊没有提供任何指导,告诉他们如何解决摘要评论中的不准确或扭曲的问题,这可能会损害他们的业务。
亚马逊咨询公司Riverbend Consulting的联合创始人莱斯利·亨塞尔(Lesley Hensell)表示,她听说有几个亚马逊卖家因为人工智能生成的摘要会影响他们的节假日销售而感到恐慌。她告诉他们,除了经常徒劳地给亚马逊的卖家支持发送电子邮件并希望有人以有意义的方式回复之外,没有其他解决方案。
她的一个客户销售了一个家居和花园产品,拥有1400个4星和5星的评价,但评论摘要中却说“一些人认为这个产品质量很差”。担心的是,买家可能会被快速摘要所吓到,而不深入阅读以了解批评性反馈仅占评价的不到2%。
“从长远来看,这对买家绝对可能是一个很好的功能,”她说。“但亚马逊需要建立一个流程,让卖家能够轻松有效地对误导性摘要提出异议,因为技术永远不会是完美的。”