什么是ChatGPT?关于这款AI聊天机器人你需要知道的事 - 《华尔街日报》
Karen Hao
11月底OpenAI发布的ChatGPT引发了全球人工智能领域的新竞赛。3月,该公司用于提升ChatGPT能力的AI模型GPT-4,进一步推高了这场竞赛的赌注。
这款聊天机器人是所谓生成式AI浪潮的一部分——这种能生成从文本到图像内容的复杂系统已经撼动了科技巨头,并即将改变行业格局与未来工作方式。
微软作为OpenAI的战略合作伙伴,已将该技术整合至全线产品,包括MS 365套件和搜索引擎必应。竞争对手谷歌则为其旗舰搜索产品添加了对话式AI功能,并推出了名为Bard的聊天机器人。中国科技巨头百度的同类产品也于3月16日首次亮相。
尽管这项技术突然爆红,但目前仍存在严重缺陷和潜在风险,包括传播错误信息与侵犯知识产权。
“如果这项技术出错,可能会造成严重后果,“OpenAI首席执行官萨姆·奥尔特曼周二向立法者表示,同时呼吁国会为先进AI制定安全标准。
以下是需要了解的关键信息。
什么是ChatGPT?
ChatGPT是由AI研究公司OpenAI开发的人工智能聊天机器人。2022年11月发布后,它能进行从哲学到历史的对话交流,以泰勒·斯威夫特或比利·乔尔的风格创作歌词,并为编程代码提供修改建议。2023年3月,OpenAI宣布将升级其处理视觉信息的能力,例如回答关于照片内容的问题。
ChatGPT的训练基于从互联网抓取的大量文章、图片、网站和社交媒体帖子,以及与OpenAI雇佣的人类承包商进行的实时对话(主要为英文)。它学习模仿写作的语法和结构,并反映常用短语。同时,它还能识别图像中的形状和模式,如猫、孩子或衬衫的轮廓,并能将单词和短语与这些形状和模式匹配,使用户可以询问图像内容,例如猫在做什么或衬衫的颜色。
该聊天机器人并不总是准确的。其信息来源未经事实核查,且依赖人类反馈来提高准确性。它也可能误判绘画或照片中的物体。
谁创建了ChatGPT?
OpenAI是一家位于旧金山的人工智能研究公司,于2015年12月由现任首席执行官Sam Altman和Elon Musk共同创立,后者在三年后因公司控制权和方向上的争议而与之分道扬镳。
Altman和Musk最初将该组织设立为非营利机构,称这种结构可以使其研究“免受财务义务的束缚”,并让他们“更专注于对人类产生积极影响”。随着公司研究日益资本密集,领导层改变了策略,于2019年成立了营利部门以吸引更多投资。
随后,OpenAI开发了ChatGPT作为帮助公司盈利战略的一部分。今年1月,微软宣布对OpenAI进行数十亿美元的新投资,并将该聊天机器人的底层技术整合到其必应搜索引擎和其他产品中。3月,OpenAI表示将不再按照其创始原则中最初声明的那样开源其系统的技术细节,以保持竞争优势。
ChatGPT和其他AI聊天机器人如何工作?
支撑ChatGPT的技术体现在其名称的后半部分——GPT,即生成式预训练变换器(Generative Pre-trained Transformer)。变换器是专门用于在数据序列中发现长距离模式的算法。它不仅学习预测句子中的下一个单词,还能预测段落中的下一句话乃至文章中的下一个段落,这种能力使其能够长时间保持话题一致性。
由于变换器需要海量数据,其训练分为两个阶段:首先在通用数据上进行预训练(这类数据更容易大规模收集),然后针对特定任务使用定制数据进行微调。ChatGPT通过在线文本海量库预训练以掌握语言规则和结构,再通过对话记录微调来学习对话特征。
该技术由Alphabet旗下谷歌研究人员于2017年开发,如今已渗透至数十种技术领域。其庞大的数据和算力需求也引发争议,这些担忧曾导致谷歌多年来对AI采取更谨慎的态度,但该公司始终持续培育该技术。
谷歌目前将变换器应用于其聊天机器人Bard,为用户提供对话式搜索应答。百度则在类ChatGPT产品文心一言中使用该技术,并计划将其整合至搜索引擎。
能够同时针对图像或图像加说明文字进行训练的Transformer模型,也是诸如OpenAI的Dall-E 2和Stability.ai的Stable Diffusion等图像生成软件系统的基础。
ChatGPT的费用是多少?
ChatGPT目前免费。OpenAI将该聊天机器人作为研究预览版发布,用户可通过专属网站体验。OpenAI还推出了每月20美元的付费版本,订阅用户可享受优先访问权。
微软和OpenAI均提供API(应用程序编程接口),允许企业将该技术整合至其产品或后端解决方案中。微软的API可通过其Azure云计算平台获取。
人们如何使用ChatGPT?
无论是起草邮件、生成软件代码,还是撰写求职信和英语作文,高管、工程师、求职者和学生都在争相使用ChatGPT来提升工作效率。医生们也一直在测试人工智能,以评估其能否协助回复患者的在线咨询。
部分雇主注意到求职者提交的ChatGPT生成答案数量激增,正努力制定此类候选人的评估标准。一些学校已屏蔽校园网络对该服务的访问以防止作弊,而另一些则积极引导学生以合乎道德的方式使用这些工具。
ChatGPT是新一代所谓生成式人工智能浪潮的一部分。图片来源:Gabby Jones/彭博新闻社请记住,OpenAI有权访问您对ChatGPT的输入和输出内容,其员工和承包商可能会为了改进服务而查阅这些内容。请避免提供私人数据或敏感的公司信息。
其他生成式AI技术,如图像生成器Dall-E 2和Midjourney,以及头像生成器Lensa,因能制作奇幻的图像和插图而受到互联网用户的欢迎。一些独立作家开始使用它们为文章创作插图,建筑师也用来为客户的新设计构思提供灵感。
AI聊天机器人有哪些缺陷?
AI聊天机器人和其他生成式AI程序是它们所消耗数据的镜子。它们会反刍和重新混合所输入的内容,既可能产生巨大效果,也可能导致严重失误。基于Transformer的AI程序故障特别难以预测和控制,因为这些程序依赖的数据量如此之大,开发人员几乎不可能掌握这些数据包含的内容。
例如,ChatGPT有时会在它吸收了高质量来源并经常与人类训练师交流的主题上正确回答问题。但在包含大量互联网错误信息的主题上,如阴谋论,以及非英语语言(如中文)中,它可能会胡言乱语。
微软对话式人工智能Bing服务的早期用户测试也显示,其评论可能开始失控,表达愤怒、执念甚至威胁。微软表示发现,在15个或更多问题的聊天会话后,Bing会开始给出奇怪答案。
与此同时,一些艺术家也表示AI图像生成器剽窃他们的艺术作品并威胁他们的生计,而软件工程师则称代码生成器大量抄袭他们的代码。
出于同样原因,ChatGPT和其他文本生成器可能输出种族主义和性别歧视内容。OpenAI表示使用人工持续优化聊天机器人输出以限制这些事故,同时采用内容审核过滤器来限制ChatGPT的回应,避免政治敏感或不当话题。
消除底层技术中的偏见——这多年来一直是个反复出现的问题,包括2016年微软那个声名狼藉的Tay聊天机器人——仍是一个未解难题和研究热点。
被誉为AI教父之一的Geoffrey Hinton近期表示将离开谷歌,以便更自由地探讨AI发展风险。
各国政府如何应对ChatGPT等工具?
出于对生成式AI工具可能被滥用于犯罪、传播虚假信息或威胁国家安全的担忧,全球各国政府正在探索监管方法。
4月,美国商务部就加强AI系统问责措施发布正式公众意见征询,例如要求潜在高风险AI模型在发布前需通过审查程序。
中国国家网信办已出台征求意见稿,要求企业在开放生成式AI服务前需通过政府安全审查——包括确保输出内容不颠覆国家政权、不煽动分裂或破坏社会秩序。
欧盟官员正着手修订去年初步通过的《人工智能法案》**,**以纳入ChatGPT等生成式AI系统。该立法将禁止特定AI服务并对其他服务实施法律限制。
微软与OpenAI有何关联?
微软是OpenAI最大投资者并独家授权其技术。据知情人士透露,这家科技巨头2019年向该AI初创公司投资10亿美元,2021年追加未公开金额,今年1月又增资高达100亿美元。根据协议,微软可利用OpenAI的研究成果(包括GPT-4和ChatGPT)开发新产品或增强现有产品,是OpenAI以外唯一能提供这些技术API的企业。
AI会取代人类工作吗?
如同历次自动化技术浪潮,最新AI技术或将深刻影响就业与未来工作形态。前几轮冲击主要波及蓝领工人,而生成式AI可能对白领职业影响更大。布鲁金斯学会2019年研究发现,市场营销专家、财务顾问和程序员等岗位受AI影响最为显著。
这些影响将是复杂的。研究自动化的经济学家发现,通常会出现三种情况:部分工人提高了生产效率,部分岗位被自动化或整合,同时也会创造出前所未有的新职位。
最终结果难以预测。在企业层面的自动化研究中,学者们发现采用自动化的公司可能提升生产力,并随着时间推移最终雇佣更多员工。但这些员工可能会遭遇工资缩水和职业发展机会减少的问题。
新创造的岗位往往呈现两极分化:要么比被自动化的工作要求更高技能,要么所需技能大幅降低。例如自动驾驶汽车既催生了对高技能工程师的新需求,也产生了对只需坐在驾驶座监控车辆的低技能安全员的需求。
本解释性文章可能会定期更新。
联系作者Karen Hao请致信[email protected]