《华尔街日报》:成立仅9个月的人工智能初创企业挑战硅谷巨头
Sam Schechner | Photographs by Edouard Jacquinet for The Wall Street Journal
巴黎——去年此时的亚瑟·门施刚满30岁,还在谷歌巴黎分部工作,人工智能刚刚开始以超越科幻概念的姿态进入公众视野。
此后,这种能像人类般对话(甚至可能推理)的生成式AI成为数十年来最受瞩目的技术突破。而门施离开谷歌创立的初创公司虽仅成立九个月,估值已超20亿美元。
这种变革速度折射出围绕高级AI系统研发与商业化的狂热——以及恐惧。
门施的Mistral AI公司正在挑战"AI竞赛赢家必属美国科技巨头"的传统认知。这位与两位工程师校友共同创业的31岁创始人认为,超大规模并非必需,美国也未必主导。
“欧洲始终缺乏科技巨头令我遗憾,“门施在巴黎办公室表示,“现在正是我们成为巨头的机遇。”
尽管获得安德森·霍洛维茨等机构超5亿美元融资,相比行业巨头,Mistral仍显渺小。微软投资的OpenAI与Alphabet旗下谷歌正斥资数十亿美元训练最新AI系统,凭借其掌握的专用芯片资源与支撑庞大电力消耗的雄厚资金。
米斯特拉尔(Mistral)以法国吹来的强风命名,其创立部分基于这样一种理念:许多资金正在被浪费。
米斯特拉尔AI位于巴黎的办公室,创始人们押注他们的小团队能智胜硅谷巨头。图片来源:Edouard Jacquinet/华尔街日报从学术界起步的芒什,毕生大部分时间都在研究如何提高AI和机器学习系统的效率。去年初,他与32岁的联合创始人蒂莫西·拉克鲁瓦和33岁的纪尧姆·兰普尔联手,后两者当时在Meta Platforms巴黎人工智能实验室工作。
他们共同押注,通过找到更高效的构建和部署AI系统的方法,这个小团队能超越硅谷巨头。而他们实现这一目标的部分方式,是将许多AI系统作为开源软件免费发布。
“我们想成为AI世界资本效率最高的公司,”芒什说,“这就是我们存在的意义。”
周一,米斯特拉尔计划发布名为Mistral Large的新AI模型。芒什表示,该模型在某些推理任务上的表现可与OpenAI迄今最先进的语言模型GPT-4及谷歌新模型Gemini Ultra相媲美。
芒什称,训练这一新模型耗资不到2000万欧元(约合2200万美元)。相比之下,OpenAI首席执行官萨姆·奥尔特曼去年在GPT-4发布后表示,训练该公司最大模型的成本“远超”5000万至1亿美元。
业界正密切关注。Mistral已吸引了包括微软在内的企业客户和投资者的兴趣——微软计划于周一宣布,将在其Azure云服务中为开发者提供Mistral新模型作为可选方案。作为协议的一部分,微软将持有该公司少量股份。
Mistral还与包括企业软件公司Salesforce及顶级GPU制造商英伟达(其产品用于构建类似Mistral的AI系统)等企业达成合作,并向其出售了少量股权。
Brave软件公司联合创始人兼首席技术官Brian Bondy表示,该公司已将Mistral的一款免费开源模型设为其浏览器内置聊天机器人的默认引擎。他认为该模型质量可与专有模型媲美,且开源特性让Brave能在本地自主控制模型。
Brave软件公司采用Mistral的语言模型作为其同名浏览器内置聊天机器人的默认引擎。图片来源:BRAVE微软AI平台企业副总裁Eric Boyd指出,Mistral正在对"精妙工程能将AI系统推向何种高度"这一命题进行引人入胜的探索。“还能走多远?“他设问,“这仍有待观察。”
身材高大、顶着一头浓密黑发的Mensch并不符合科技极客CEO的典型形象。亲友同事形容他喜欢在啤酒宴谈中妙语连珠。作为运动健将,他在2018年完成博士论文前数月,以不到3.5小时的成绩跑完了巴黎马拉松。
门施长期在学术追求与创业抱负间拉扯。他成长于巴黎西郊,母亲是物理教师,父亲经营一家小型科技公司。
这位未来的首席执行官曾就读法国顶尖的数学与机器学习院校。导师们评价他是个即使毫无基础也会热情投入项目并迅速精通的学生。
“我确实喜欢新体验,“门施说,“但我厌倦得也很快。”
贯穿始终的是他对效率提升的执着。攻读博士期间,门施致力于升级功能性磁共振成像系统的三维脑图像分析软件,使其能处理数百万张图像——绘制负责数学运算、面部识别等功能的脑神经网络图谱。
这位Mistral创始人于2023年春季离开当时名为DeepMind的谷歌部门。图片来源:Jeff Chiu/美联社2020年底,门施加入当时名为DeepMind的谷歌人工智能部门,在构建大型语言模型的团队工作——这类AI系统后来为ChatGPT提供技术支持。到2022年,他已成为关于新型AI模型"Chinchilla"论文的主要作者之一,该研究颠覆了学界对AI模型规模、训练数据量与性能表现之间关系的认知,即AI扩展定律。
“要挑战世界对扩展定律的认知,还有谁比参与定义这些定律的人更合适?“Mistral早期投资人莎拉·郭通过其风投公司Conviction表示。
随着2022年人工智能竞赛白热化,门施表示他对大型私营AI实验室开始减少发表关于大语言模型的论文、与更广泛的研究界分享成果变少感到失望。ChatGPT一经推出,谷歌内部就展开了追赶竞赛。门施称他的团队从10人扩大到30人,继而增至70人。
“我想我是在公司变得过于官僚化之前离开的,“门施说,“我不想在科技巨头内部构建不透明的技术。”
亚瑟·门施长期在学术追求与创业抱负间徘徊图片来源:Édouard Jacquinet/华尔街日报米斯特拉尔去年春季向投资者提交的初步推介文件,谴责了由美国公司主导销售专有模型形成的"寡头垄断格局”。
早期阶段,门施曾游说法国政策制定者(包括总统马克龙)反对欧盟新AI法案中的某些条款,他警告这些规定可能拖慢企业发展,且在他看来对提升AI安全性毫无助益。经过布鲁塞尔方面的文本修改后,门施表示该法案对米斯特拉尔将成为可承受的负担,尽管他认为法律本应聚焦AI应用方式而非同时监管底层技术。
对门施及其联合创始人而言,将初始AI系统作为开源项目免费供所有人使用或修改是重要原则。这也是吸引渴望获得更多AI控制权的开发者和潜在客户的策略。不过米斯特拉尔最先进的模型(包括周一发布的版本)并未开源。
“显然,在构建商业模式与坚持我们的开源价值观之间,存在着微妙的平衡,”门施说。“我们想发明新事物、新架构,同时仍希望为我们的客户提供额外的可销售产品。”
联系萨姆·谢克纳,邮箱:[email protected]