AI写高考作文,才是真的大材小用了_风闻
互联网那些事-有态度 够深度06-09 23:27
2023年高考刚结束,“AI考生”的答题热情却迎来新的高潮。
6月7日,随着各种“高考”话题一起登上热搜的还有“AI写高考作文”。
高考题目一出来,我们就从数学、语文、英语三大学科对讯飞星火、ChatGPT和各家模型进行了高考真题对比测试。
先上结果:
语文作文因为主观性和随机性,几位老师测评结果不一,但讯飞星火名列前茅;在英文测试中,ChatGPT和星火显著领先其他家;在更考验思维逻辑的数学测试中,讯飞星火正确率50%,超过ChatGPT和其他各家模型,排名第一。
这时我们才发现,一个月前讯飞星火的发布会上,科大讯飞董事长刘庆峰说的“星火在文本生成、知识问答、数学能力三大能力上已超ChatGPT”,绝非虚言。
这时我们才发现,一个月前讯飞星火的发布会上,科大讯飞董事长刘庆峰说的“星火在文本生成、知识问答、数学能力三大能力上已超ChatGPT”,绝非虚言。
以语文为例,我们先向“讯飞星火”进行了提问:2023年全国高考甲卷的作文题目是什么?并分析一下它传递的意义。
没想到“星火”不仅知道刚出炉的作文题,甚至连题目背后的意义都理解的透彻。
不得不说,AI大模型是懂中国高考的,但是好的裁判就是好的选手吗?我们继续测试,让讯飞星火根据今年的全国甲卷作文“人·技术·时间”写一篇作文。
看来星火不仅是技术流,也是实践派,讯飞星火的这篇作文算是优秀范文了。
不止作文,我们喂给讯飞星火英语、数学等高考题目后,其展示出来的能力也是相当惊人。一道颇有难道的函数多项选择题,讯飞星火也是秒算结果。
距离星火大模型发布只有短短一个月,现在科大讯飞又发布了“讯飞星火认知大模型”V1.5,还推出了星火助手中心和星火APP等创新产品,同时星火大模型在教育、办公、工业、医疗等领域的进一步商业落地成果也被逐一展演。
星火大模型是怎么做到后发先至的?
一 讯飞星火的自进化
一个月前,科大讯飞在发布“讯飞星火认知大模型”时,给出了年内持续升级的明确里程碑:
第一个里程碑如期兑现,那实际效果如何?
发布会现场,升级后的讯飞星火在开放式问答、多轮对话能力、数学能力等方面都表现出色。现场真机实测的互动环节,大模型的精彩回答,让人眼前一亮,现场充满笑声和掌声。
首先是“开放式知识问答”取得突破。
在写给高考结束的孩子的暖心信里,星火不仅引经据典,更是写的很有“人”情味,确实有点暖心。
第二是多轮对话能力再次升级。
我们通过一个异想天开的童话故事开头,然后中间不断打断星火,加入一些“奇葩”的情节,星火都能自圆其说,最后生成一个有情节有逻辑的故事。
第三是,数学和逻辑能力再升级。
无论是考验逻辑能力的“三人两对父子”。
还是考验计算能力的“直角交叉线”,讯飞星火的表现都很优秀。
为什么做大模型的很多,讯飞星火迭代的这么快?
做好大模型需要很强的技术门槛,而科大讯飞是有先发优势的。贵为“人工智能第一股”的科大讯飞从1999年诞生时就有AI基因。
2011年承建语音及语言信息处理国家工程研究中心;2012年开发“讯飞语点”;2014年发布“讯飞超脑”,要实现机器从“能听会说”到“能理解会思考”;2017年获批承建认知智能全国重点实验室;2022年发布“2030讯飞超脑计划”,提出要让“懂知识、善学习、能进化”的机器人进入每一个家庭。
2022年12月,科大讯飞正式启动“1+N”认知大模型专项攻关,2023年5月就正式上线了“讯飞星火”。
可以说,正是因为有了十几年的厚积薄发,才有了我们看到的讯飞星火上线就破发的亮眼表现。
二 To C,星火给每个人一个AI助手
科技的每一次进步都能够激发人类的热情。
无论是汽车、电脑还是智能手机,从概念到大规模普及,所需时间越来越短。ChatGPT发布仅2个月用户就已经过亿,技术阶跃和快速进化让AI在全球掀起热潮。
未来“智能涌现”的AI很可能会像手机电脑一样,成为人们生活、娱乐、工作的刚需。
智能手机激发了移动互联网,认知大模型也正在改变我们获取和发布信息的方式。
发布会上,科大讯飞推出了“星火助手中心”和“星火APP”。
前者依托语言理解升级,打造了覆盖工作及生活丰富场景的200+个快捷助手,有五大板块、24个应用场景,从职场到日常生活,让人们对“AI助手”从想象开始变成现实;后者则通过手机端的交互体验提升,让“大模型”福利全家桶都“装进手机”随身携带,提供一键式解决方案。
我们实测了讯飞智聘模拟面试,提出“我是一名即将毕业的大学生,我想面试产品经理的岗位。”讯飞星火立即在线呈现了一场教科书般的面试交锋,这对需要面试演练的毕业生和职场人非常实用。
可以预见的未来,我们只需滑动手机,周报邮件、策划方案就能信手拈来,朋友圈的吸睛文案、给爱人的暖心情话,都不再需要斟字酌句的“冥思苦想”。
