科技公司寻求增长之际,ChatGPT热潮席卷中国——《华尔街日报》
Karen Hao and Shen Lu
ChatGPT的病毒式流行在中国掀起热潮,在经历两年监管整顿和新冠疫情的冲击后,科技公司一直在寻找新的增长来源。
搜索引擎运营商百度、电商巨头阿里巴巴集团以及社交媒体巨头腾讯控股等企业已宣布投资开发自己的同类产品,以对标这款未在中国开放的人工智能聊天机器人。其他中国公司近期股价因跟风炒作而暴涨,引发官媒对投机性上涨发出警告。
AI和中国科技行业专家表示,早期投资生成式AI技术的中国企业目前最有条件打造自己的ChatGPT,这类技术能像人类一样生成文字、图像和艺术作品。但更多企业正竞相追赶美国同行在最新技术发展和商业应用方面的步伐。
尽管中国拥有多家领先的AI企业,但多数聚焦于计算机视觉及监控等应用领域。ChatGPT则需要来自自然语言处理这一不同子领域的技术储备。
中国企业还面临地缘政治和审查相关障碍,包括获取受美国出口管制的先进芯片,以及应对中国政府严格的内容审查规定。
尽管如此,具备技术实力的企业将成为快速跟进者。卡内基国际和平基金会研究员马特·希恩表示,对于这类企业而言,“中国要追赶并重建甚至开发出更优模型,并不存在实质性障碍”。
ChatGPT的开发者OpenAI禁止中国用户注册聊天机器人账号,但许多人已通过虚拟专用网络或花费几美元在电商平台购买账号绕过限制。ChatGPT能生成中文回答,其惊艳、出人意料时而出错的回应成为中国社交媒体热议话题,部分消费者开始呼吁推出国产替代品。
今年1月传出百度相关计划,该公司拟于3月将自研AI聊天机器人"文心一言"整合至搜索引擎。百度周三表示还将利用该技术优化百度智能云、自动驾驶系统及小度语音助手。
百度CEO李彦宏在分析师电话会议中表示,公司将向公众开放大语言模型并提供商业服务。他透露已有机构决定将文心一言集成至其产品服务中。
随后腾讯(微信母公司)、电商巨头京东、语音识别公司科大讯飞相继表态——尽管均未公布具体方案。游戏公司网易称正探索将ChatGPT底层技术应用于教育产品。外卖平台美团联合创始人王慧文虽自称技术了解有限,仍宣布计划投资5000万美元打造"中国版OpenAI"。
阿里巴巴是最早开发自有中文大语言模型的公司之一,这类模型正是ChatGPT的技术基础。图片来源:沈来来/彭博新闻ChatGPT的基础是所谓的大语言模型,该模型通过海量语言数据进行训练。此类模型可用于一系列商业应用,从改进搜索结果、驱动语音助手到自动化内容审核。
在中国,百度和阿里巴巴是最早开发自有中文版本的公司。百度于2019年发布了名为"文心一言"的模型,随后与谷歌和OpenAI的发展同步推进,并用于优化其搜索引擎。同年阿里巴巴推出了"AliceMind",两年后又发布了"M6"。“AliceMind"为阿里客服聊天功能"阿里小蜜"提供技术支持。
电信巨头华为技术有限公司、IT综合企业浪潮集团,以及政府支持的北京智源人工智能研究院和中国科学院,也都研发了各自的版本。
中国企业现在正是依托这些基础模型向类ChatGPT产品演进。但专家表示,只有少数公司能快速实现这一目标。
原因之一是中国企业获取多样化数据的渠道较为有限。ChatGPT基于当今最大的语言模型之一——OpenAI的GPT-3.5,该模型受益于全球互联网上涵盖多学科领域的海量英文数据。而中文数据不仅总量较少,在国内还面临严格的内容审查控制。
搜索引擎运营商百度计划将自研AI聊天机器人整合至搜索引擎中。图片来源:沈启来/彭博新闻香港科技大学人工智能研究中心主任冯雁表示,除公开数据外,多数中国企业仅掌握金融或电商等特定领域的文本及对话数据。她指出,百度因通过搜索引擎爬取网络数据而拥有独特优势。
美国对高端芯片的出口管制可能构成另一重挑战。最新研究显示,过去两年中国开发的大多数大型语言模型均基于美国制裁的英伟达A100图形处理器训练完成。乔治华盛顿大学研究技术变革的政治学者、该论文合著者丁杰弗里指出,一旦企业耗尽高端芯片库存,技术发展速度或将放缓。
中国严格的审查与监管环境将从其他方面制约发展。ChatGPT曾出现传播错误信息或生成怪异冒犯性内容的问题。中国科技专家表示,本土企业面临更大压力,需确保其聊天机器人不会对政治敏感话题过度发挥。
hello earth
你好,
世界,
你好地球