中国百度开发自己的ChatGPT，加入全球AI竞赛 - 华尔街日报

Karen Hao and Raffaele Huang

2023-01-30

中国的百度公司已投身于一场全球竞赛，旨在将新一代人工智能技术如ChatGPT商业化，这些技术可能彻底改变互联网。

该公司正在开发一款类似OpenAI旗下热门产品ChatGPT的AI聊天机器人，并计划于三月将其整合至核心搜索引擎中，知情人士透露。

此举将使总部位于北京的百度成为全球少数拥有自主版本该技术的科技企业。这项技术已引发消费者和企业的广泛关注，并对现有企业施加压力，促使它们开始调整产品开发战略。

百度有望成为首个向中国消费者提供该技术的企业。在中国，互联网受到国家审查且ChatGPT的访问受到限制。

百度制定计划之际，华盛顿与北京之间围绕提升各自国家在战略新兴技术领域领导地位的竞争正日趋激烈。

这也凸显了人工智能研究流动、跨境的本质——开源是这一领域的常态。据部分知情人士称，OpenAI构建ChatGPT的核心突破基于Alphabet旗下谷歌2017年开发的算法，百度同样采用了该算法并作为其聊天机器人的技术基础。

据《华尔街日报》看到的百度内部网站记录显示，百度首席执行官李彦宏在12月下旬向部分员工发表的讲话中提及ChatGPT，称其代表着新的机遇。

“我们拥有如此酷炫的技术，但能否将其转化为人人需要的产品？“李彦宏在提及包括聊天机器人在内的人工智能驱动技术时说道，“这实际上是最困难的一步，但也是最伟大、最具影响力的。”

彭博社早前报道过百度的相关计划。

百度的发展速度一直未能跟上中国其他互联网同行的步伐，该公司一直致力于转型为人工智能企业，在包括自动驾驶汽车和专为人工智能应用提供动力的芯片等技术上投入了数十亿美元。

利用其搜索引擎业务积累的海量文本数据，百度特别专注于人工智能研究的一个领域——自然语言处理。该领域在过去几年取得了重大突破，并推动了包括ChatGPT在内的人工智能技术近期的爆发式增长。

2019年，百度基于谷歌的突破性技术开发了名为"文心”（Ernie）的深度学习模型，用于改进其搜索结果，使其更具相关性。此后，该公司又开发了数十个文心模型，并将其功能扩展到包括图像和艺术生成，类似于OpenAI的Dall-E。

百度CEO李彦宏向员工表示，重大挑战在于将公司的"酷炫技术"转化为人人需要的产品。图片来源：吴红/Shutterstock据知情人士透露，百度正以文心大模型（Ernie）作为其聊天机器人的基础，并同时在中国防火墙内外使用中英文资料进行训练。根据其开源研究论文，百度过去曾利用维基百科、BookCorpus、Reddit以及百度百科、百度新闻等自有产品生态训练文心大模型。

一位知情人士表示，百度计划按照国家内容审核规则限制聊天机器人的输出。OpenAI同样对ChatGPT的输出施加限制，以避免有害仇恨言论和政治敏感话题。

行业研究人员指出，基于海量互联网文本数据训练的ChatGPT能以流畅对话形式回答各类用户问题，但无法保证答案准确性，有时会产生性别歧视或种族主义言论。

包括微软和谷歌在内的科技巨头正加速完善ChatGPT底层技术，并将其整合至搜索引擎等产品中——其对话能力被认为最有可能颠覆现有格局。

据《华尔街日报》报道，2019年及2021年投资OpenAI的微软宣布追加高达100亿美元投资，将ChatGPT整合至必应搜索引擎等产品线。

谷歌的一项类似技术LaMDA于2021年首次亮相，Meta Platforms公司也在2020年发布了名为BlenderBot的聊天机器人，但两者均未透露将这些技术整合到其平台的计划。

联系Karen Hao，邮箱：[email protected]；联系Raffaele Huang，邮箱：[email protected]

本文发表于2023年1月31日印刷版，标题为《中国百度加入全球AI竞赛，开发自己的ChatGPT》。