人工智能芯片初创公司如MatX风暴硅谷-彭博社
Ashlee Vance
插图:Nico H. Brausch for Bloomberg Businessweek经过大约25年的时间,硅谷终于再次感觉像老派的硅谷。
英伟达公司已经完全主导了为人工智能软件提供动力的芯片市场,其他公司已经决定他们愿意尝试设计自己的半导体,尽管这通常是一个充满风险的过程。历史告诉我们,从零开始设计一款芯片需要数年时间,耗资数亿美元,通常以失败告终。然而,人工智能的前景如此之大,以至于人们决定他们必须尝试。
这些勇敢的人中有两位是Mike Gunter和Reiner Pope。他们创立了一家公司,MatX,其目标是专门设计用于处理驱动大型语言模型所需数据的硅片。如果你在过去一年半里一直躲在地堡里,那么你可能不知道,LLM是诸如OpenAI Inc.的ChatGPT和Google的Gemini等东西的基础,它们需要大量昂贵的芯片才能运行。如果一家公司能够生产更便宜、更快速、更适合人工智能的芯片,那么它将在不断扩大的人工智能软件世界中表现出色。
教皇(左)和冈特。摄影师:Anya McClatchie冈特和教皇此前在Alphabet Inc.的Google工作,冈特专注于设计硬件,包括用于运行AI软件的芯片,而教皇则编写AI软件本身。多年来,Google一直在构建自己的AI芯片,称为张量处理单元。然而,这些芯片在LLM真正开始起飞之前就被设计出来了,对于当前手头的任务来说太过通用,MatX的高管们表示。“我们曾试图让Google的大型语言模型运行得更快,并取得了一些进展,但这有点困难,”教皇首次公开谈论他的公司时说道。“在Google内部,有很多人希望对芯片进行各种改变,而且很难专注于只有LLM。出于这个原因,我们选择离开了。”
Nvidia在AI硅市场的主导地位有些偶然性。该公司最初制造的芯片被称为图形处理单元(GPU),用于加快视频游戏和某些计算机设计工作的速度。Nvidia的芯片擅长处理大量小任务,恰好在大约十年前开始蓬勃发展的AI软件方面表现比Intel Corp制造的其他类型芯片更好。
Nvidia将其GPU上的资源划分为处理各种计算任务,包括在芯片内部传输数据。其一些设计选择更适用于过去的计算时代,而不是AI繁荣时期,并伴随着性能折衷。MatX的创始人们认为,这些额外的资源增加了不必要的成本和复杂性,在新的AI时代采取了一种从零开始的方法,设计了一个专注于尽快相乘的一个大型处理核心的硅片——这是LLM核心任务的核心。该公司打赌——这是一种赌博,要么成功,要么失败——他们的芯片在训练LLM和交付结果方面至少比Nvidia的GPU好10倍。“Nvidia是一个非常强大的产品,显然是大多数公司的正确选择,”教皇说。“但我们认为我们可以做得更好。”
MatX已经筹集了2500万美元,最近一轮融资由AI投资双人组Nat Friedman和Daniel Gross领导。该公司位于加利福尼亚州山景城,距离硅谷第一家晶体管工厂肖克利半导体实验室仅几英里,有数十名员工正在忙碌地研发公司计划明年推出的芯片。“MatX的创始人象征着我们人工智能世界的一个趋势,”Gross说,因为他们“正在利用一些最好的想法,这些想法是在一些最大的公司中开发的,这些公司有点行动缓慢和官僚主义,然后他们自己将这些想法商品化。”
如果AI软件继续按照目前的路径发展,将会对昂贵的计算产生巨大需求。正在开发中的模型据估计每个训练成本约为10亿美元,预计它们的后继者将需要花费100亿美元进行训练。MatX预测,通过赢得包括OpenAI和Anthropic PBC在内的许多主要AI参与者,公司可以拥有一个蓬勃发展的业务。“这些公司的经济模式与典型公司完全相反,”Gunter说。“他们把所有这些钱花在计算上,而不是工资上。如果事情不改变,他们将用尽资金。”
硅谷,正如其名称所示,过去充斥着芯片公司。有数十家初创公司,甚至计算机巨头惠普、IBM和太阳微系统都生产自己的芯片。然而,在更近的历史中,英特尔通过主导个人电脑和服务器市场扼杀了许多这些努力,而三星电子和高通等公司则主导了智能手机组件。由于这些趋势,投资者开始远离投资芯片初创公司,认为它们比软件更昂贵、耗时和风险更大。“大约在2014年,我会拜访风险投资公司,他们已经撤掉了所有了解半导体的合伙人,”曾投资于MatX的芯片专家Rajiv Khemani说。“我会面对一些完全不明白我在说什么的人。”
人工智能的崛起改变了风险与回报的平衡。拥有庞大资源的公司,包括亚马逊、谷歌和微软在内,已经投资设计了他们自己的张量芯片用于人工智能工作。几年前,像Groq Inc.和Cerebras Systems Inc.这样的初创公司出现在市场上,推出了第一波专门用于人工智能的芯片。但这些产品是在重大技术人工智能突破之前设计的,这些突破导致LLMs成为人工智能主导故事。这些初创公司不得不适应对LLMs的突然兴趣,并试图即时调整他们的产品。MatX很可能代表了又一波从头开始专注于LLMs的芯片初创公司的开始。
进入芯片行业的一个巨大问题是,设计和制造一款新芯片需要三到五年的时间。(当然,Nvidia在此期间不会停滞不前,事实上,本月宣布了一款速度更快的版本的GPU。)初创公司必须预测技术趋势和竞争将会发展到何种程度,几乎没有错误的余地,因为错误可能会拖慢生产速度。软件公司通常必须重写他们的代码以在新的半导体上运行,这是一个昂贵且耗时的过程,他们只会在预计转换将带来巨大回报时才会这样做。一般规则是,新芯片必须至少比之前的产品好十倍才有可能说服客户全部转移他们的代码。
至于Gross,他预测我们正处于建立支持向人工智能转变为主导计算形式所需基础设施的早期阶段。“我认为我们正在进入一个将使其他周期相形见绌的半导体周期,”他说。如果他是对的,那么几乎可以肯定会有新的芯片帝国出现。阅读下一篇: 金牌程序员构建了一个可以替代他们工作的人工智能