李彦宏说透了国产大模型的现在与未来_风闻
财经无忌-财经无忌官方账号-独特视角记录时代冷暖昨天 13:26
文 | 无锈钵 山核桃
“中国的大模型很多,但是基于大模型所开发出的AI原生应用却非常少。”
11月15日,深圳2023西丽湖论坛上,百度创始人、董事长兼首席执行官李彦宏对国内AI市场给出的研判。

作为《时代》周刊所评选的全球AI领袖企业创始人,李彦宏留给人们的印象,一直是人工智能行业最坚定的支持者。
过往几个月里,身处AI赛道广阔前景之中“振奋感”,几乎贯穿了他的每一场公开演讲。即便是私下里为《智能革命》一书作序,他也毫不掩饰对于行业的期待:
“全世界都在为即将到来的人工智能革命感到兴奋。”
而在刚刚结束的西丽湖论坛上,面对国内大模型领域的“过热”现象,这个小小的传统被打破了,取而代之的则是一盆迎面的“冷水”。
正如他在演讲开头,抛出的那句直切主题的开场白一样:
“人工智能很热,但我想首先谈几个‘冷’思考。”
1、热过的大模型,何时“退烧”?
大模型赛道很火爆,这是过去的大半年里,各界人士都能直观感受到的现象。
然而,只有行业中感知最敏锐的那批人才能意识到,当下的大模型赛道,不仅广受关注,而且已经有了明显的“过热”迹象。
当下,人工智能行业“模型层—中间层—应用层”的宏观架构之中,大模型已经跃马当先,成为了占据绝对资源优势的主角。
“人工智能每收获1块钱投资,就有6毛钱流向了大模型。”
这个类比并不夸张,数据统计现实,2023上半年,国内人工智能领域共发生161起投融资事件,其中超过半数投融资直指算力设施和大模型业务,而涉及具体应用侧面的,不足四分之一。

从发布大模型的时间节点来看,国内的大模型训练起步,平均要晚于美国3年左右,然而据钛媒体《2023AI大模型应用中美比较研究》报告显示,单从数量来看,截至2023年7月底,国内市场已经累计问世了超过130个大模型,甚至超越了同期的美国市场。
大模型超量涌现的另一边,正如李彦宏所提到的那样:
“很多行业、企业,甚至很多城市还在买卡、囤芯片,建立智算中心,想要从头训练自己的专用大模型。”
这种反常的“过热”背后,是越来越多从业公司、投资者和企业品牌的集体“迷失”。
**对于从业公司来说,**大模型之于AI行业,犹如操作系统之于互联网产业,是不折不扣的“基础设施”,无论是短期红利还是长期前景,都非常可观。
**而对于投资人来说,**入股算力中心、开发大模型也是“更保险”的商业行为,一方面,AI的中间层和应用层还没有跑出类似ChatGPT、文心一言这样的头部企业,缺乏现有案例参考,另一方面,相较于看不见的原生应用,买实体芯片、建算力中心更能直观的看见资金流向,从而帮助平衡投资风险。
最后,很多企业对此更是理解不深,顺着媒体和舆论的炒作,以为拥抱人工智能就是引入大模型,最终误入歧途,造成了对公司资源和社会资源的巨大浪费。
回望过去,各方复杂的博弈与思考,铸就了如今大模型的“过热”现象。

长期来看,这一现象所带来的危害已经逐步显露:
人工智能产业架构中,相较于模型层的落后,应用层本来可以成为国内市场弯道超车美国的机遇,然而当前过热的大模型赛道,虹吸了过多本该投放于应用层的资源,来“重复造轮子”,拖累了应用层的木桶板。
对此,李彦宏同样深有感触:
“人类进入AI时代的标志,是出现大量的AI原生应用,而不是出现大量的大模型。”
从这个角度来说,国产大模型,或许是时候该吃上一剂“退烧药”了。
2、AI原生带来的改变,才刚刚开始
类比互联网产业,操作系统所衍生的红利,固然成就了微软这一硅谷巨擘,但硬件层的英特尔、英伟达,软件层的亚马逊、谷歌、Meta、Netflix,以及产品终端的苹果、三星、华为等企业,同样向世界诠释着其他产业层级所蕴含的丰厚机遇。
同样的,人工智能产业要想收获长足发展,也必须要实现各个层级的均衡发展,多点开花。
当前阶段,意识到这一点的硅谷,已经开始了“各就各位”的新发展阶段,围绕相对成熟的大模型工具,开始朝细分方向衍化新应用。
参考美国的人工智能市场发展阶段,“AI原生应用”的崛起,需要两个前置条件:
·底层的基础设施——大模型已经具备了较为成熟的能力
·头部大模型已经实现了市占率领先,围绕大模型的内卷告一段落
对应OpenAI的高市占率,在国内大模型市场,以文心一言为代表的头部大模型,已经成为了开启“AI原生时代”的关键钥匙。
从技术水平来看, 新发布的文心4.0在理解、生成、逻辑和记忆四大能力上,已经迎来显著提升;正如李彦宏所提到的那样,“4.0是迄今为止最强大的文心大模型”。
具体而言,在生成能力上,文心一言除了生成文字内容,还包括了图片、视频、数字人等多模态内容,可实现的创作体裁超过200种,涵盖了几乎所有写作需求。在逻辑和记忆能力上,相比之前的版本也有了成倍提升。
另一侧的市场占有率上, 文心大模型更是“遥遥领先”。
截至10月中旬公布的数据,文心一言面向全社会开放以来,用户规模已经达到7000万,开发者5.4万,场景4300个,应用825个,插件超过500个。具体到调用量数据,也如李彦宏所说“可能比国内200多家加起来的调用量还大”,并且还在不断呈现指数级的增长趋势。

从这个角度来说,伴随着文心一言等头部大模型的逐步成熟化,国内大模型市场千帆竞逐、野蛮生长的初级阶段,已经从事实上宣告结束。
基于这一背景条件,对于国内当前的人工智能市场来说,围绕文心一言等头部大模型,开启应用层的“AI原生时代”,已经是“正当其时”。
这也是为什么,李彦宏在演讲的开头重点呼吁:
“如果我们能够更加鼓励基于大模型的AI原生应用,就一定能够构建起一个繁荣的AI生态,推动新一轮的经济增长。”
3、繁荣AI应用生态下的“百度解法”
在中国的科技大厂中,百度是最早一批确立AI为核心战略的企业,在过去诸多公开场合中,李彦宏对AI的热情贯穿始终,百度也在“一号位”的带领下,率先自上而下完成AI重构。
但正如李彦宏在演讲中所说的:“我认为直到今天,中国也好,美国也好,最好的AI原生应用还没出现。”
这句研判并非没有根据。红杉资本在其刷屏报告《生成式AI进入第二阶段 》中提到,当前市场正在进入“第二幕”,一切的炒作最终会被真正的价值和完整的产品体验所取代。
从全球范围来看,无论如微软、谷歌这样的科技巨头,还是OpenAI这样的独角兽,都在利用AI原生应用夯实自身的护城河,这已是确定性的趋势。微软虽然自己不下场最大模型,但借助和OpenAI的联盟,已完成Office全家桶的AI化,另一边的OpenAI则在最近的开发者大会上,直接推出了GPT Store,呼吁个人与开发者打造自己的专属GPTs。
也正是这种对技术价值的长期研判,催生出李彦宏的呼吁:“我们需要的是100万量级的AI原生应用,而不是100个所谓的大模型”。
当价值锚定,剩下就是如何去做,如何真正开启一个健康、繁荣的“AI原生时代”?
事实上,李彦宏与百度想的也非常清楚:这不是一道靠一家或两家企业完成的选择题,而是一道需要多方合力共同参与的开放题。
首先,拥抱AI时代,必须是一项“一把手、一号位”工程。 在李彦宏看来:“大企业天然保守,对新生事物不敏感,不愿意冒险”。他提到一些行业乱象,比如,很多企业只认为拥抱AI是IT部门的事,要么天马行空地想要从0到1自己去大炼基础模型,要么就只看评测榜单选一个模型,最终的结果只会造成资源浪费。

如何避免内耗,发挥AI真正的价值,李彦宏给出的解法是企业的“一号位”。这一点也并不难理解。一方面,没有人比一号位更关注新技术对业务关键指标所起的作用,另一方面,只有自上而下的意志传达,形成统一共识,才能实现合力。
李彦宏是这么说的,百度也是这样做的。 正如上文所提到的,百度率先自上而下完成AI重构的中国企业,不仅是各产品线的AI原生化重构,更是上下意志的统一。
其次,技术必须服务需求,从具体的行业场景与业务场景找痛点,与技术做结合。 现在很多企业都在陷入一种算力恐慌,但正如李彦宏所说的“无论是芯片也好、框架也好、模型也好,都需要AI应用来驱动。”
换言之,只有通过更多的场景应用,才能驱动算力和数据步入正循环轨道。
最后,更好的生态才能催生更多的创新。 中国的大模型厂商不能闭门造车,让AI真正实现普惠必须降低门槛,为更多企业、开发者与个人提供更便捷的工具链与解决方案。
“百度从做AI的第一天,就非常重视生态的建设”。李彦宏这样说。目前,百度飞桨已拥有800万AI开发者,不久前,百度发布的文心一言插件生态平台“灵境矩阵”,相当于为大模型提供了“手和脚”,插件以一种以轻量化的形式,降低了使用门槛,让用户科技结合自身的业务场景与需求,快速创新,进而真正发挥让大模型的通用能力真正落地于场景。
插件生态之外,对于一些企业级与行业客户而言,如何让大模型更好地落地产业,关键要让大模型用的顺手、用的长久,百度智能云千帆大模型平台就通过更完善的大模型产品、工具和服务,目前已有超17000家企业在这里开发产业模型和解决方案。
对李彦宏与百度来说,他们足够熟悉AI,也靠着多年的AI蓄力等来了如今的蜕变重生,在西丽湖上的这份冷思考与热驱动,某种程度上,是李彦宏的真心话,也是百度经历过AI时代完整周期的经验总结与价值理解。
正如Robin在演讲最后所提到的那样:
“希望每个人都行动起来,去使用它、体验它、投入到AI原生应用的创新中,共同创造一个百花齐放、无限可能的AI原生时代。 ”
附:李彦宏《AI原生时代:“冷”思考和“热”驱动》演讲实录
尊敬的各位领导、各位嘉宾,大家好!很高兴来深圳参加西丽湖论坛。我想借此机会,跟大家分享我对大模型和AI原生应用的一些思考。我演讲的主题是《AI原生时代:“冷”思考和“热”驱动》。现在人工智能很热,但我想首先分享两个“冷”思考。
第一个,中国的大模型很多,但是基于大模型开发出来的AI原生应用却非常少。有报道说,截止10月份国内已经发布了238个大模型,而6月份的时候这个数字是79个,相当于4个月就翻了3倍。但中国有多少AI原生应用呢?我想在座的各位,很少有人能说出一二个来。如果我们看国外,除了有几十个基础大模型之外,实际上,已经有了上千个AI原生应用,这是在中国市场上没有的。而我认为,人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。为什么这么说?我们看PC时代,基本上只有Windows一个操作系统,但是基于Windows系统开发的软件有很多;移动互联网时代,主流操作系统也只有安卓和iOS两家,而移动应用有800万之多。大模型时代其实也是类似,大模型本身是一个基础底座,类似操作系统,那么最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。所以,不断地重复开发基础大模型是对社会资源的极大浪费。
AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。如果我们的产业政策能够更加鼓励基于大模型的AI原生应用,我们一定能够构建起一个繁荣的AI生态,推动新一轮的经济增长。
第二个冷思考,由于没有智能涌现能力,专用大模型的价值其实非常有限。我看到一个现象,很多行业、企业,甚至很多城市都在买卡、囤芯片,建立智算中心,想要从头训练自己的专用大模型。殊不知这样炼出来的大模型是没有智能涌现能力的。因为,只有当你的模型的参数规模足够大,训练数据量足够多并且能够不断投入,进行迭代,才能够产生智能涌现,大模型才能具有触类旁通的能力。也就是说,你没教过的东西,它也会了。所以,大模型的产业化模式,应该是把基础模型的通用能力和行业领域的专业知识相结合。也就是大模型套小模型,专用的小模型反应快,成本低,大模型更智能,可以用来兜底。
自从8月31号开放以来,文心大模型的API调用量,呈现了指数级的增长。国内有200多个大模型,上了这个榜单、进了那个排名,但其实调用量是很小的。文心大模型一家的调用量比这200多家大模型的调用量加起来还要多。
刚才说了两个“冷”思考。作为一个在AI领域工作超过十年的从业者,我对大模型和AI原生应用的巨大价值和影响力,都深信不疑。所以我想说一说,AI原生时代的三个“热”驱动。
第一,强大的基础模型,会驱动AI原生应用爆发。中国有领先的基础大模型,这是AI原生应用发展的坚实基础,是底层的能力。3 月16日,百度率先发布了基于文心大模型3.0的文心一言产品,之后快速迭代。
第一个,中国的大模型很多,但是基于大模型开发出来的AI原生应用却非常少。有报道说,截止10月份国内已经发布了238个大模型,而6月份的时候这个数字是79个,相当于4个月就翻了3倍。但中国有多少AI原生应用呢?我想在座的各位,很少有人能说出一二个来。如果我们看国外,除了有几十个基础大模型之外,实际上,已经有了上千个AI原生应用,这是在中国市场上没有的。而我认为,人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。为什么这么说?我们看PC时代,基本上只有Windows一个操作系统,但是基于Windows系统开发的软件有很多;移动互联网时代,主流操作系统也只有安卓和iOS两家,而移动应用有800万之多。大模型时代其实也是类似,大模型本身是一个基础底座,类似操作系统,那么最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。所以,不断地重复开发基础大模型是对社会资源的极大浪费。
AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。如果我们的产业政策能够更加鼓励基于大模型的AI原生应用,我们一定能够构建起一个繁荣的AI生态,推动新一轮的经济增长。
第二个冷思考,由于没有智能涌现能力,专用大模型的价值其实非常有限。我看到一个现象,很多行业、企业,甚至很多城市都在买卡、囤芯片,建立智算中心,想要从头训练自己的专用大模型。殊不知这样炼出来的大模型是没有智能涌现能力的。因为,只有当你的模型的参数规模足够大,训练数据量足够多并且能够不断投入,进行迭代,才能够产生智能涌现,大模型才能具有触类旁通的能力。也就是说,你没教过的东西,它也会了。所以,大模型的产业化模式,应该是把基础模型的通用能力和行业领域的专业知识相结合。也就是大模型套小模型,专用的小模型反应快,成本低,大模型更智能,可以用来兜底。
自从8月31号开放以来,文心大模型的API调用量,呈现了指数级的增长。国内有200多个大模型,上了这个榜单、进了那个排名,但其实调用量是很小的。文心大模型一家的调用量比这200多家大模型的调用量加起来还要多。
刚才说了两个“冷”思考。作为一个在AI领域工作超过十年的从业者,我对大模型和AI原生应用的巨大价值和影响力,都深信不疑。所以我想说一说,AI原生时代的三个“热”驱动。
第一,强大的基础模型,会驱动AI原生应用爆发。中国有领先的基础大模型,这是AI原生应用发展的坚实基础,是底层的能力。3 月16日,百度率先发布了基于文心大模型3.0的文心一言产品,之后快速迭代。