国产大模型又添一把“火”，烧起来了！_风闻

互联网那些事-有态度够深度05-08 10:07

2023-05-08

每一个“哈利波特”迷都渴望有一个进入魔法世界的9¾站台。

而每一个进入魔法世界的魔法师又都想进入“有求必应屋”，在那里一切的难题都有解决办法，海伦娜形容它：如果你还需要问，就永远不会明白；如果你明白，你只需要开口问。

对于提供捷径的“万事通”，人们一直向往。

权谋剧《琅琊榜》中有至高无上的情报机构“琅琊阁”，主打“衡量天下大事，盘点世间英雄”，所有的疑难事在这里也都有答案。

这些天马行空的想象因为科技正在变成现实。

2023年开年，ChatGPT“提问、回答”模式刷新了人们对AI的认知，之后大模型就一直处于最热的风口。

国内互联网企业们先后发布了文心一言、通义千问等大模型，给赛道添火加温，而成立20多年的“人工智能第一股”科大讯飞发布的认知大模型——“星火”，则把多模态大模型的想象拓展到新的层级。

大模型赛道越来卷。

一体验一把星火大模型，挺香！

国产大模型真的太卷。

卷到就连名字都是各种引经据典，文心一言、通义千问、混元、言犀……在这些兼具气势和野心的名字里，“讯飞星火”显得有点过于朴素。

24年前，中国的语音市场被国际巨头占领，为了实现“中文语音要做到世界最好”的目标，6个中科大在校大学生开始了艰难的创业之路，才有了今天的科大讯飞。

“燃烧最亮的火把，要么率先燎原，要么最先熄灭。”这句当初的创业口号至今还刻在科大讯飞总部大楼的墙上。

取名“星火”，既是致敬当初创业的初心，更是对AI二次创业的信心和决心，星星之火必将燎原。

星火发布会现场解释“星火”的含义

那么星火大模型能力究竟如何？对比其他大模型有什么不同？我们分别对“ChatGPT”“星火”、“文心一言”从文字编排能力、中文输出能力和逻辑能力三个方面进行了实测。

测试1：写一个无法拒绝的请假条。

ChatGPT的回答

讯飞星火的回答

文心一言的回答

面对基础的语言文字问题，三款AI工具都可以看似按照需求的完成任务，其中讯飞星火的语法和措辞更为接近国人的口吻，不仅说出了原因，还给到请假之后的解决方案。

领导看到这样的请假条，确实“无法拒绝”。

测试2：以“我挂断了跨越时间的电话”为开头，发挥想象，写一篇故事。

ChatGPT的回答

讯飞星火的回答

文心一言的回答

想象力上三款AI工具各有千秋，都有跨越时空的情节，ChatGPT的回答符合西方的科幻情节，讯飞星火和文心一言的更符合中文语境下的时空想象，其中讯飞星火的回答中“电话”的线索一直都在，且首尾呼应，像一篇成熟的短篇小说。

测试3：同时抛掷两枚质地均匀的硬币，正面向上和反面向上的概率分别是多少？

考验的是逻辑能力。

ChatGPT的回答

讯飞星火的回答

文心一言的回答

针对逻辑性的测试，三款AI工具都没有翻车，给出的答案都是准确的。

不同的是ChatGPT有很清晰的解题逻辑，思维缜密；文心一言只有答案，即使追问解题过程也没有更多回答；讯飞星火则介于二者之间，有简单的解题逻辑，文字表达也清晰，四种结果一目了然。

整体测评下来，感觉三款AI工具都各有千秋，但讯飞星火的中文表达、逻辑等更强。

在星火大模型发布现场，更是围绕讯飞星火认知大模型的七大核心能力，“大胆”语音实测。

星火不仅对现场随机提问机智回答，甚至在回答“女朋友生气了该怎么办”这样的问题时，展现出极高的情商。

科大讯飞董事长刘庆峰自豪的表示，当前讯飞星火认知大模型在文本生成、知识问答、数学能力三大能力上已超ChatGPT。他还进一步公布大模型年内三次升级时间点，10月底将整体赶超ChatGPT。

二星火，真的可以燎原

在互联网行业，评价一个产品好坏的标准是有多少商业价值，这在大模型赛道同样适用。

和ChatGPT面向C端不同，星火认知大模型的定位不仅有C端，更偏向B端。

作为以中文为核心的新一代认知智能大模型，讯飞星火拥有跨领域的知识和语言理解能力，定位是一个通用的赋能平台，教育、办公、医疗等千行百业，都可以基于这个平台来实现智能化变革，创造商业价值。

讯飞星火认知大模型成果发布会上，讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱、讯飞开放平台等5项应用成果也同步发布。