《南华早报》| DeepSeek开源突破如何重塑人工智能创新

Winston Mok

2025-02-12

DeepSeek V3和R1的突破性表现虽不能保证中国人工智能发展持续领先，但确实表明美国市场领军者的竞争优势并非如曾经认为的那般不可逾越。在创新周期被压缩至数月的高度竞争性AI领域，顶尖大语言模型(LLM)排名可能随着每一代新产品的推出而重新洗牌。如今这些动态竞赛中已包含中国LLM参与最高水平角逐，挑战美国传统主导地位。农历新年首日，阿里巴巴发布Qwen 2.5 Max，宣称其表现优于DeepSeek V3和美国的领先LLM。尽管DeepSeek R1已实现与OpenAI o1持平，但新发布的o3具备更强功能。DeepSeek在资源有限情况下取得了惊人成就。然而要与美国市场领导者保持竞争力，仍需通过利用日益壮大的开源AI生态系统等途径获取外部资源，持续改进。令世界震惊的不仅是DeepSeek的强劲表现，更是它如何以远少于在投资、计算能力和时间方面。这一成就是通过工程优化和基于现有基础实现的。该公司采用了蒸馏技术，将来自更大、更复杂模型的知识转移到较小模型中，同时保持强大的性能。这种包括蒸馏在内的相互学习，是工业和学术AI开发中的常见做法。DeepSeek R1的高级推理能力使其进入了之前由OpenAI的o1主导的领域。在OpenAI旗下，“推理"o1在某些高级数学和编码任务上表现出色。但DeepSeek R1以显著降低的使用成本提供了可比的能力——仅收取o1使用费用的一小部分。