王小川投身大模型,思路是什么?他会怎么做?_风闻
极客公园-极客公园官方账号-04-11 07:29

王小川说,自己不想做中国的 OpenAI,而是世界的百川智能。
作者 | 陈晨
编辑| 郑玄****
「今天距离 ChatGPT 发布,已经第 131 天了。」
身着橙色帽衫,王小川走进一间近 30 平米的会议室,在这里,他宣布了自己即将投入创业的大模型产品名叫「百川智能」。「川」字一语双关,既象征了河流汇聚入海的过程,如同数据汇聚产生支持;又隐含了自己的名字,「我把自己也放进去了。同时也意味着需要更多人才加入进来。」
这场内部交流会可谓低调,现场没有 PPT,王小川对着一台 iPad 讲述完自己的创业背景与愿景,过程中楼上不时传来一阵阵装修的电钻声。这是在搜狐网络大厦的二层,戏剧性的是,不久前亦投入大模型创业的王慧文所创立的光年之外也在这栋大楼办公。
而本次创业的启动资金也同样低调——「百川智能」由 5000 万美金启动,据王小川本人介绍,资金部分来源为他个人出资,其余为几位友人的个人支持。相比光年之外的两亿美金融资(未宣布 close),在大模型领域,五千万美金并不是一笔引人瞩目的金额。但王小川表示,将产品从 0 到 1 跑通,这笔钱在初期够用了。
但据极客公园了解,王小川完全可以拿到更大金额的融资,他却选择了相对较小的初步启动资金。在大模型领域大消息不断的 3 月,外界环境的变化令他逐渐从冲动过渡到冷静,选择了以极低调的身姿入场,为的是「不让早期团队有太大压力」。
事实上,早在一个月前王慧文高调入局后,王小川就开始了与产学界和政府有关部门的密切交流。最近他在社交平台上发布了不少言论,称如果机器掌握了语言,则强人工智能的时代就要到来。在此次交流会上,王小川强调,创业搜狗的背景是他带领团队做大模型的最大优势。「搜索就是做语言,在 AGI 方向,做语言是很大的优势。」而据极客公园观察,这一个月以来,王小川也是大模型创业者中,最被业内看好的一个。
在「百川智能」目前公布的图景中,目标是「要构建中国最好的大模型底座」——「最好」体现在参数、品测以及体验。与别家大模型有所区别的是,「百川智能」将率先在教育、医疗两个垂类领域做知识增强,目标是要帮助大众获得普惠知识,帮助企业做通用服务。底座产品目标在年底公布,垂类产品可能会提前公布。
人才是大模型领域竞争的关键词。王小川透露,「百川智能」到月底团队会接近 50 人,不到一半是搜狗班底。而半个月后他本人就要飞去美国继续招募技术人才。
有趣的是,这场交流会的灵感来自 ChatGPT,当王小川问及 ChatGPT:如何招到更多更好的大模型领域人才?ChatGPT 给出的回答是,你要先对外界讲清楚你的逻辑。于是才有了这场交流会。
有关此次创业的融资节奏,王小川的表现和外界的狂热期待并不相符,当被极客公园问及这是否仍是职业经理人作风,而非创业者身位——他笑着回答,「我习惯了一切 ready 才公布,我承认这有职业经理人的惯性思维,但我走出来了,所以先选择向大家公布。」
01
从狂热,到冷静
王小川低调官宣的背后,是过去数月大模型创业从狂热到冷静的一个缩影。
说起王小川,第一个浮现出的标签往往是「理工天才」,他有着世人对「理工男」刻板印象里的那些特质:做事审慎,不想好不出手。但在大模型这件事情上,王小川最初也曾陷入狂热之中。
就在王慧文在朋友圈宣布做中国版 OpenAI 的前一天,创业者社区「前沿社」举行了一场关于通用大模型的线上交流会。**「OpenAI 正在展现出一场革命的开篇,这将是是互联网和移动互联网之后,同等量级的产业变革。」**会上,极客公园创始人张鹏提出这个观点,并在与会者中发起投票。
一共 13 票投向认同,这里面第一个投票的就是王小川。参与活动多次以来,那一晚是他一年多来表达最多,也最兴奋的一次。
在这场交流活动上,王小川是 ChatGPT 最坚定的支持者之一。当几位参加交流的 AI 领域创业者,尝试仅仅从功能上定义 ChatGPT 的进步的时候,王小川甚至明确表态,说大家「把这件事想小了」。
「我看到了 AGI(通用人工智能)的曙光!」王小川说这是他去年末开始体验 ChatGPT 的时候,内心最强烈的感觉。并且在这次讨论活动里,第一次含蓄透露了自己可能也会参与大模型这场变革的态度。
在 2023 年 2 月 12 日极客公园前沿社的一次「AGI 信徒聚会」上,王小川第一次明确表达了「早就下决心肯定要入局」的决心。或者说,王慧文的突然高调入场,实际上打乱了王小川原本四平八稳的节奏,某种程度上帮他走出了「经理人的思维」,开始激活了「肾上腺素」。

左起:李志飞、周源、王小川、翟光龙、张鹏
极客公园从接近王小川的人士处得知,在王慧文高调宣布入局后一周左右的时间内,王小川也曾准备对外宣布入局。但那段时间密集的舆论热潮,外界不上船就要被落下的 FOMO 心态,让他最终开始刹车反思自己急匆匆宣布,是否真的有必要。

王小川最熟悉的「老地方」
王小川沉默的这段时间,其他先放出消息的团队开始了紧锣密鼓的筹备工作。王慧文设立北京光年之外科技有限公司,吸引了顶级 VC 上亿美元的认购。
另一位宣布投身大模型领域的出门问问的创始人李志飞,曾向极客公园表达过他的观点,他认为,通用 AI 大模型就像是核武器,入局确实有时间窗口。「人才壁垒、时间壁垒、数据壁垒、资金壁垒一旦建立起来,小的团队就没有戏了。」王小川和李志飞也是很熟悉的朋友,他也认同这个观点,但是他也提出了一个观点——「这事情不能上头,还是要走心多思考下。」
在过去一段时间中,确实有些东西是值得思考的。比如以最早宣布入局的王慧文为例,一个月过去了,即使手握大笔资金,招到足够人才,特别是一个业界被认可的首席科学家或者 CTO,依旧是充满挑战的任务。
而从收购 AI 架构公司一流科技 Oneflow,到意向收购两家清华 NLP 团队的初创公司——深言科技和面壁智能。也体现了王慧文希望尽快用最短路径集结人才,而这恰恰体现了大模型创业的复杂性,资本意义重大,但不是唯一决定性的因素。
而王小川在 AI 领域的积累和在技术产品领域的个人品牌和经验,确实让他在思考后,可以选择另一种入局的方式。
02
融资思路为何变化?
值得关注的第一个不同的思路,就是王小川为何把启动资金设在 5000 万美元。
在 ChatGPT 问世的时候,王小川曾经发过一条朋友圈说:OpenAI 的胜利,是技术理想主义的胜利。
从创立公司到推出 ChatGPT,OpenAI 整整走过了八年,在那之前,他们投入了大量的资金和资源。但也正是这种对技术的信仰,才能让他们取得震惊世界的成就,在 AGI 的前夜,为自己赚取今天难望其项背的领先优势。
最初国内创业者都是想做中国的 OpenAI,也就是做底层的通用大模型,这件事背后的逻辑很简单:
OpenAI 不能进入中国,国内一定需要自己的大模型。
互联网大厂会做大模型,但他们吃不下所有市场。有业务重合的公司不会把命脉交给大厂,所以创业团队就有生存的空间。
OpenAI 已经踏出了一条成功的路径,如果哥伦布已经发现了新大陆,你在这个方向上,就有可能用更短的时间和更少的资源在国内做出同样的事情。
几个月过去,今天来看前两者都没有问题。但复制OpenAI的路径,却看起来越来越有挑战。
3 年前发布的 GPT-3,还只是一个基础的底座;
半年前的 AI 机器人 ChatGPT(GPT-3.5),已经是一个完整的产品,并具备了泛用场景下对话这个更高阶的技术能力;
一个月前的 GPT-4,则具备了更强的推理能力和多模态转化能力;
几周前,OpenAI 宣布支持 ChatGPT 插件,后者已经不只是一个产品,而是一个生态,甚至是操作系统。
以大模型能力为基础,OpenAI 已经构建起产品能力、商业化能力和生态能力,这为他们积累了大量用户,而数据飞轮效应进一步加快 OpenAI 迭代基础大模型。
如果说做一个大模型的难度系数是 1,想要快速做出能对标 ChatGPT 水平的、「完全开放式对话产品」的难度是 100 了。
既便王小川决心要做中国的 OpenAI,甚至最终要超越他。那么他核心要面对的问题就是:
你要做哪一年的 OpenAI?2015 年的?2020 年的?2023 年的?还是 2025 年的?每一年 OpenAI 的能力体系都是不一样的,新的创业者如何建立自己的特点、差异化和优势呢?
从追赶到超越,一个创业公司的万里长征第一步要怎么走?第一个里程碑设立到哪里?第一个能闭环的商业循环是什么?
当面对 OpenAI 在过去数年烧掉数十亿美元构建起的完整生态,复制相同的路径需要的资源,不论是 5000 万美元还是几亿美元,如果不考虑造势问题,其实都是杯水车薪。
比较务实的思考是如何迅速启动,设定合理的里程碑,并且用最高的效率,以及超预期的结果到达里程碑,那么后续的资源才会源源不断。
据参与了王小川本轮融资的好友透露,王小川正是出于这个考虑,改变了之前设定的融资计划。在内部交流会上,王小川被问及五千万美金是否经过详细的计算,他透露,「从 0 到 1,5000 万的启动资金就够了。但要持续做到最好,我估计应该是从 3 亿-20 亿美元之间。」
03
王小川想要怎么做?
交流会上,王小川给出了百川智能现阶段的几个目标:
构建中国最好的大模型底座。
在几个方向加强:搜索的增强,多模态的增强,教育、医疗等知识层面的增强。
相比 OpenAI 专注在一个通用模型,百川智能则会同时发展垂类模型和通用模型。
对于通用大模型,王小川称,百川智能目前已经开始训练 500 亿参数的模型,进展很顺利,年底前预计会发布对标 GPT-3.5 的大模型,有信心今年年底做到国内最好。
相比之下,垂类模型预计会出来的更快。尽管垂类模型的通用性没法与 OpenAI 抗衡,但可以通过针对具体场景优化,在细分场景里达到与 OpenAI 相近的效果,从而积累用户、构建起生态,跑通小闭环。
而王小川选择的几个场景,除了搜索这个老本行外,选择医疗、教育这两个垂类赛道,是因为这两个行业「对知识的要求最高」,而这个特征也会是大模型最先落地的方向。
甚至王小川曾经与参与本次投资的朋友表示,大模型的之外,最需要花精力的,是打造超级应用的思考和实践,「最大最成功的公司一定是在应用上想得最清楚的公司。」
显然,中国 OpenAI 这件事,今天已经不只是大模型本身的竞争,而是大模型、超级 App、行业应用三合一的「新铁人三项」赛了。
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO