深度求索结束为期一周的马拉松式AI模型细节披露 | 南华早报
Ben Jiang
中国人工智能初创企业深度求索(DeepSeek)近日用一周时间公开了其开发ChatGPT竞争产品的技术细节,该项目的实现成本仅为行业常规投入的零头,此举有望推动全球AI领域加速发展。过去几天里,深度求索在全球最大开源社区GitHub上公布了八个开源项目。这是该公司首次详细披露如何从计算、通信和存储等模型训练三大核心环节中充分释放芯片性能。
这支由年轻科学家组成的团队表示,他们公开这些"经过实战检验的构建模块",是为了"以完全透明的方式分享我们微小但真诚的进步"。
全球开发者纷纷为深度求索点赞,盛赞这家中国公司公开了构建低成本高性能AI模型的技术。AI开发平台Hyperbolic创始人等开发者更称深度求索是"真正的OpenAI"。
尽管名为"开放"AI,ChatGPT的创造者OpenAI却转向了闭源模式,对其模型的具体训练方法和计算成本严格保密。OpenAI创始人兼CEO萨姆·奥尔特曼今年2月初曾表示,公司"站在了历史的错误面",“需要制定新的开源战略”。