《南华早报》| 中国初创企业深度求索或将重塑人工智能领域游戏规则
Zhou Xin
中国最热门的人工智能初创企业展现出以远低于OpenAI等行业领军者的成本开发AI模型的能力。其最新发布的推理模型DeepSeek-R1"可与OpenAI的o1媲美",但研发成本却低得多。
关于深度求索的团队、资金和芯片资源仍有许多未公开信息,但这位AI界的"最大黑马"已发布足够技术细节证明:相比Meta、OpenAI等科技巨头,其开发大语言模型(包括开源的DeepSeek V3)的成本要低得多,却能提供相近的性能表现。
2025年1月7日制作的资料照片显示Meta首席执行官马克·扎克伯格与公司标识。图片来源:法新社
深度求索的突破引发热议。对其支持者而言,该公司的成功对中美AI竞争乃至人工智能未来具有重大意义。当2022年11月山姆·奥特曼团队推出ChatGPT时,中国措手不及。中国科技企业仓促推出自家大模型,陷入"百模大战"的混乱局面,但两朵乌云已给这场热潮降温。
第一个潜在影响是美国对先进图形处理器(GPU)的出口限制,尤其是英伟达备受追捧的芯片——这一限制使中国在人工智能领域失去了最强大的武器。
第二个影响是中国大型科技公司相比美国同行资金有限。根据"规模法则"(即"对先进芯片投入越多,模型性能越好"),中国AI企业处于不利地位。
然而,深度求索(DeepSeek)证明中国能够克服这两大挑战。换言之,中国可以找到"聪明"的方法来训练强大AI模型,而无需堆砌先进芯片或巨额预算。若这一路径可持续且可复制,则意味着美国通过芯片限制遏制中国AI发展的企图将落空。中国政府显然注意到了这一突破的重要性——深度求索创始人梁文峰上周受邀作为代表之一在北京与李强总理会面。