解读 | DeepSeek的成功对英伟达及高成本GPU驱动AI发展意味着什么 | 南华早报
Zhou Xin
中国人工智能初创企业深度求索(DeepSeek)的成功,首个重大"受害者"竟是英伟达(Nvidia)——由于市场担忧这家杭州公司的技术突破可能降低行业对这家美国芯片巨头高端产品的依赖,其股价在周一暴跌17%。尽管英伟达在周二盘前交易中有所回升,但分析师指出,在由GPU驱动的高成本AI开发领域,市场对该公司角色的认知正在发生改变,这给全球最具价值的科技巨头之一带来了威胁。
深度求索取得了哪些突破?
深度求索宣称其V3模型仅使用2048块英伟达H800 GPU进行了为期两个月的预训练,每块芯片每小时运行成本约2美元。该模型总训练成本550万美元,耗费280万GPU小时,远低于同类竞品。
本月早些时候发布的开源推理模型R1,在性能上已可媲美OpenAI、Anthropic和谷歌的更先进模型,但训练成本显著降低。
深度求索是否证明英伟达芯片并非不可替代?
尚未定论。深度求索创始人梁文峰2023年接受《晚点LatePost》采访时透露,公司已逐步储备超1万块英伟达GPU,使其成为中国AI初创企业中算力资源最雄厚的企业之一。