Deepseek引通用人工智能新热潮,全栈国产深度推理大模型讯飞星火即将升级
guancha
春节期间,Deepseek引发的全球关注,推动国内通用人工智能迎来一个新的高潮。市场分析人士认为,DeepSeek热潮主要得益于国产大模型技术的快速发展,以及美国对华算力管控趋严,在目前背景下,国产替代逻辑将持续强化。
值得注意的是,春节前夕,国内人工智能龙头企业科大讯飞在其内部年会上宣布,即将对其全国产算力深度推理大模型星火X1进行重大版本升级。此次升级将进一步提升星火X1在数学、教育、医疗、科研等关键领域的性能,确保其在这些领域始终保持业界领先水平。
大模型算力需求:训练与推理的差异
大模型的研发和应用离不开强大的算力支持。大模型对算力的需求主要体现在两个方面:训练和推理。其中,训练是指利用海量数据对模型进行学习,使其具备特定的能力;推理则是指利用训练好的模型对新的数据进行处理和分析,从而完成特定任务。
科大讯飞相关人士表示,从技术难度来看,训练实现的难度远大于推理实现的难度。这是因为训练过程需要处理的数据量更大,计算复杂度更高,对算力平台的稳定性和效率也提出了更高的要求。这也是为什么目前包括华为在内的众多国产GPU厂商和云计算厂商宣布可以在国产算力平台上提供推理服务,而只有讯飞星火一家大模型是训练和推理均在国产算力上进行的原因。
2024年1月30日,科大讯飞推出了星火3.5,这是首个基于全国产算力训练的大模型,也是迄今为止国内唯一一个。2025年1月15日,科大讯飞又推出了首个使用全国产算力训练的深度推理模型星火X1,这标志着国产算力训练大模型又迈出了关键一步。据悉,星火X1仅使用了1万张910B国产算力卡,就取得了大模型研发上的一系列成果。这背后离不开科大讯飞在国产算力平台上的大量无人区适配和效率优化工作。可以说,科大讯飞真正把国产算力做到了极致效率,是技术实力和战略勇气的体现,也为后续国产大模型做国产算力适配趟平了道路。
全栈国产化:战略意义与先发优势
据参考消息援引美媒报道,美国海军基于“潜在安全和道德问题”,已要求人员避免以任何形式使用中国公司的DeepSeek模型。同时,硅谷数据标注公司Scale AI创始人Alexander Wang表示:美国政府为保持领先优势,需要对DeepSeek的 AI 芯片进行调查和管制。
随着DeepSeek引发的美国对华算力管控进一步趋严,科大讯飞所构建的大模型全栈国产化技术具有战略意义和先发优势。全栈国产化意味着从硬件到软件,从训练到推理,整个大模型产业链都实现了自主可控,这将有效降低我国人工智能产业发展对国外技术的依赖,保障国家人工智能战略安全。随着国产算力水平的不断提升和应用场景的不断拓展,相信未来会有更多国产大模型基于国产算力生态涌现出来,推动我国人工智能产业迈向新的高度。