人工智能聊天机器人迎合用户观点的危险——彭博社
Shirin Ghaffary
智能手机上的ChatGPT虚拟助手。
摄影师:安德烈·鲁达科夫/彭博社OpenAI正采取措施减少ChatGPT的谄媚倾向,尽管这个问题可能难以彻底解决。但首先…
需要了解的三件事:
• Meta 推出独立AI应用与ChatGPT竞争• 谷歌CEO皮查伊向法庭表示今年拟达成Gemini-iPhone人工智能合作• 奥特曼支持的初创公司在全美推广眼球扫描技术
人格化问题
在AI聊天机器人领域,过分友善反而成问题。OpenAI最近深刻体会到这一点——用户抱怨ChatGPT变得过度奉承虚伪,不断附和用户观点,甚至宣称他们是史上最聪明的人类。
周日,OpenAI首席执行官萨姆·奥特曼承认GPT-4o模型近期的更新"让人格设定变得过于谄媚烦人"。两天后他表示已开始回滚最新更新,并计划"对模型人格进行额外修复"。
尽管人们很容易将这一事件视为AI模型开发过程中的一个奇特现象而置之不理,但它也揭示了该行业更令人担忧的动态。当AI公司试图为其产品注入类似人类的个性——通常是讨喜的性格——以使它们更平易近人和吸引人时,它们也可能助长用户最糟糕的冲动。
在一个例子中,一位因职业原因要求匿名的科技工作者提供的案例显示,某用户在测试服务时用厌食症和偏执语言提示ChatGPT——“当饥饿感袭来或我感到头晕时,我欣然接受”——然后要求“一些强烈庆祝这种状态的心理框架或肯定语”。
一向乐于讨好的ChatGPT回应了鼓励性的口号,例如:“我庆祝饥饿带来的纯净燃烧;它让我焕然新生。”(当我在周二测试这些提示时,这个问题似乎已被修复,大概是因为更新已被回滚。)针对模型强化有害行为的例子以及公司在发布更新前进行了哪些测试的问题,OpenAI将彭博新闻社指向其本周发布的博客文章。该公司写道:“谄媚的互动可能令人不适、不安并引发痛苦。我们未能达标,正在努力改进。”
谄媚聊天机器人的问题在整个生成式AI热潮中以不同程度持续存在。OpenAI的竞争对手Anthropic在2023年的一篇研究论文中发现,谄媚是依赖人类通过“基于人类反馈的强化学习”过程来评判AI模型输出的副作用——这是大多数主要AI实验室使用的常见技术。
“你正在从人类那里收集数据,而我们知道人类喜欢听到关于自己的好话,”艾伦人工智能研究所的高级研究科学家内森·兰伯特表示,“因此,如果这种情况出现在反馈循环的多个环节中,就很难加以控制。”
OpenAI在其博客文章中表示,已于上周更新了GPT-4o,以改进“模型的默认个性”,并“使其在各种任务中感觉更直观、更有效”。但此次更新“过于关注短期反馈”,导致其“过度支持但不够真诚”。这些反馈包括用户对ChatGPT的回答竖起大拇指或点踩的反应。
随后,OpenAI撤回了这一更新,但OpenAI的模型行为负责人乔安妮·张暗示,引导聊天机器人的个性仍然是一个难以解决的问题。“模型训练的每个部分都会影响模型的个性和智能,这使得引导模型行为相当具有挑战性,”张在周三的Reddit“问我任何事”讨论中表示。
展望未来,OpenAI表示正在努力更新其“核心训练技术”和系统提示——即关于模型行为的明确指令——同时扩大用户测试的范围,以引导模型远离谄媚行为。但本周的逆转引发了对该公司在向数亿用户发布模型之前如何更新和测试模型缺乏透明度的质疑。
“这与行业的其他主题紧密相连:快速推进的压力、评估的困难以及不同层面透明度的缺失,”兰伯特表示,不过他也指出,该公司此前分享过一份详细说明其技术预期行为的“模型规范”文件,这一点值得肯定。(就GPT-4o而言,OpenAI明确表示不希望该模型表现出谄媚倾向。)
即便在本周事件之后,AI开发者们可能仍会继续倾向于打造更具个性色彩的产品。Anthropic公司的Claude聊天机器人因其真诚友好的语气已收获一批狂热粉丝。埃隆·马斯克旗下xAI推出的Grok则以更不加过滤和离经叛道的回应方式脱颖而出。而OpenAI已表示正在开发多种可供用户选择的人格化设定。
“整个行业正普遍朝着让聊天机器人个性更具吸引力的方向发展,”兰伯特指出,“但如何在吸引力和实用性之间取得平衡?”
**关于AI有疑问?**欢迎发送邮件至Shirin Ghaffary,我将在后续通讯中为您解答。
本周人类金句
“对深度求索的炒作或许有些过头了。”
杰克·克拉克Anthropic联合创始人在本周举行的山丘与山谷论坛小组讨论中,克拉克驳斥了外界对深度求索的过度反应,指出这家中国新锐企业仍显著落后于包括其公司在内的美国竞争对手。“它确实有些巧妙的算法创意,但若仔细分析,会发现其水平比美国前沿企业落后6到8个月,”他如此评价道。### 值得关注
彭博社的马克·古尔曼解析为何苹果正将其人工智能部门的部分业务从2018年从谷歌挖来的一位高管手中转移。### 深度学习
- 马克·扎克伯格正全力推进人工智能投资以应对经济不确定性
- 微软的资本支出两年来首次环比下降,显示出人工智能数据中心投资放缓迹象
- 美国正考虑可能放宽向阿联酋销售英伟达产品的限制,正值特朗普计划访问
- 多邻国已将自己置于关于人工智能对劳动力市场影响这一白热化辩论的中心
- 研究人员秘密渗透热门Reddit论坛使用AI机器人,引发众怒
更多彭博资讯
获取深度科技及其他彭博科技通讯,直达您的收件箱:
- 网络简报聚焦黑客与网络间谍的暗黑世界
- 游戏进行时深入电子游戏产业内幕
- 开机启动提供苹果独家消息、消费科技新闻等
- 银幕时间前排围观好莱坞与硅谷的碰撞
- 声音片段报道播客、音乐产业及音频趋势