国产大模型又添一把“火”,烧起来了!_风闻
互联网那些事-有态度 够深度05-08 10:07
每一个“哈利波特”迷都渴望有一个进入魔法世界的9¾站台。
而每一个进入魔法世界的魔法师又都想进入“有求必应屋”,在那里一切的难题都有解决办法,海伦娜形容它:如果你还需要问,就永远不会明白;如果你明白,你只需要开口问。
对于提供捷径的“万事通”,人们一直向往。
权谋剧《琅琊榜》中有至高无上的情报机构“琅琊阁”,主打“衡量天下大事,盘点世间英雄”,所有的疑难事在这里也都有答案。
这些天马行空的想象因为科技正在变成现实。
2023年开年,ChatGPT“提问、回答”模式刷新了人们对AI的认知,之后大模型就一直处于最热的风口。
国内互联网企业们先后发布了文心一言、通义千问等大模型,给赛道添火加温,而成立20多年的“人工智能第一股”科大讯飞发布的认知大模型——“星火”,则把多模态大模型的想象拓展到新的层级。
大模型赛道越来卷。
一 体验一把星火大模型,挺香!
国产大模型真的太卷。
卷到就连名字都是各种引经据典,文心一言、通义千问、混元、言犀……在这些兼具气势和野心的名字里,“讯飞星火”显得有点过于朴素。
24年前,中国的语音市场被国际巨头占领,为了实现“中文语音要做到世界最好”的目标,6个中科大在校大学生开始了艰难的创业之路,才有了今天的科大讯飞。
“燃烧最亮的火把,要么率先燎原,要么最先熄灭。”这句当初的创业口号至今还刻在科大讯飞总部大楼的墙上。
取名“星火”,既是致敬当初创业的初心,更是对AI二次创业的信心和决心,星星之火必将燎原。
星火发布会现场解释“星火”的含义
那么星火大模型能力究竟如何?对比其他大模型有什么不同?我们分别对“ChatGPT”“星火”、“文心一言”从文字编排能力、中文输出能力和逻辑能力三个方面进行了实测。
测试1:写一个无法拒绝的请假条。
ChatGPT的回答
讯飞星火的回答
文心一言的回答
面对基础的语言文字问题,三款AI工具都可以看似按照需求的完成任务,其中讯飞星火的语法和措辞更为接近国人的口吻,不仅说出了原因,还给到请假之后的解决方案。
领导看到这样的请假条,确实“无法拒绝”。
测试2:以“我挂断了跨越时间的电话”为开头,发挥想象,写一篇故事。
ChatGPT的回答
讯飞星火的回答
文心一言的回答
想象力上三款AI工具各有千秋,都有跨越时空的情节,ChatGPT的回答符合西方的科幻情节,讯飞星火和文心一言的更符合中文语境下的时空想象,其中讯飞星火的回答中“电话”的线索一直都在,且首尾呼应,像一篇成熟的短篇小说。
测试3:同时抛掷两枚质地均匀的硬币,正面向上和反面向上的概率分别是多少?
考验的是逻辑能力。
ChatGPT的回答
讯飞星火的回答
文心一言的回答
针对逻辑性的测试,三款AI工具都没有翻车,给出的答案都是准确的。
不同的是ChatGPT有很清晰的解题逻辑,思维缜密;文心一言只有答案,即使追问解题过程也没有更多回答;讯飞星火则介于二者之间,有简单的解题逻辑,文字表达也清晰,四种结果一目了然。
整体测评下来,感觉三款AI工具都各有千秋,但讯飞星火的中文表达、逻辑等更强。
在星火大模型发布现场,更是围绕讯飞星火认知大模型的七大核心能力,“大胆”语音实测。
星火不仅对现场随机提问机智回答,甚至在回答“女朋友生气了该怎么办”这样的问题时,展现出极高的情商。
科大讯飞董事长刘庆峰自豪的表示,当前讯飞星火认知大模型在文本生成、知识问答、数学能力三大能力上已超ChatGPT。他还进一步公布大模型年内三次升级时间点,10月底将整体赶超ChatGPT。
二 星火,真的可以燎原
在互联网行业,评价一个产品好坏的标准是有多少商业价值,这在大模型赛道同样适用。
和ChatGPT面向C端不同,星火认知大模型的定位不仅有C端,更偏向B端。
作为以中文为核心的新一代认知智能大模型,讯飞星火拥有跨领域的知识和语言理解能力,定位是一个通用的赋能平台,教育、办公、医疗等千行百业,都可以基于这个平台来实现智能化变革,创造商业价值。
讯飞星火认知大模型成果发布会上,讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱、讯飞开放平台等5项应用成果也同步发布。
