人工智能的3440亿美元“语言模型”赌注看起来脆弱 - 彭博社
Parmy Olson
摄影师:利昂内尔·博纳文图尔/法新社每个投资者都知道不要把所有的鸡蛋放在一个篮子里。那么,为什么硅谷只押注于一种构建人工智能的方式呢?
今年,全球四大科技公司 将花费3440亿美元用于人工智能,主要用于训练和运行所谓的大型语言模型(LLMs)的数据中心,这些模型可以处理文本、音频和视觉内容。这项技术在很大程度上是基于预测序列中下一个出现的标记的相同技术。
当然,他们的支出并非全无意义。个人使用的聊天机器人 已经在快速增长,一些人工智能初创公司开始实现盈亏平衡,企业仍在利用生成性人工智能的早期阶段进行自我提升。大型语言模型代表了第一种在巨大规模上实现主流采用的人工智能技术:例如,每周有超过7亿人使用ChatGPT。
彭博社观点* 风能和太阳能会提高能源价格吗?这要看情况
- 共和党的福音派基础需要警惕
- 因爱泼斯坦而流放安德鲁不足以修复王室
- 艾玛·汤普森的NSFW咆哮正是人工智能热潮所需要的 但历史上充满了那些对单一“获胜”技术方法过于执着的人,他们在环境突然变化时却落后了。想想黑莓对物理键盘的执着,直到苹果公司用触摸屏将其击垮,或者雅虎在门户网站上的重大赌注,而谷歌却悄然主导了搜索。
一种新颖的人工智能方法是否会突然颠覆所有投入聊天机器人技术的资本?也许会。中国的DeepSeek在一月份发布了一种更小、更高效的模型,并在网上发布了其蓝图,提供了如何以非常规方法 让市场感到惊讶 的一瞥。
DeepSeek的模型是一个大型语言模型,但其方法表明,今天投入人工智能研究的所有资源推动了一股潮流,可以提升其他领域。通过其历史,人工智能一直通过将过去的见解与新想法相结合而向前发展,而对超智能机器的追求可能也不例外。
现在,许多探索发生在像Covariant这样的地方,这是一家位于湾区的初创公司,正在开发软件以帮助机器感知其周围空间,而不是在数据中筛选模式。专注于机器人技术和无人机、药物发现或气候建模的公司,往往自然地远离语言模型的痴迷,因为他们的技术需要实时响应物理世界的条件。
Atman Labs是一家英国初创公司,正在挖掘深度学习出现之前的想法,这些想法“也很重要,但已被遗忘,”联合创始人Sumon Sadhu表示。他们的路径与谷歌DeepMind多年努力通过不同途径构建超智能人工智能的努力相呼应——从像AlphaGo这样的游戏AI系统到一种称为强化学习的基于模拟的技术——直到ChatGPT的发布将公司的全部焦点转向大型语言模型。
现在,大型语言模型理论出现了一些裂痕,从令人瞩目的成本到收益递减的前景。OpenAI或谷歌的最新模型仅比旧模型稍微好一些,即使在其开发中投入了更多资金。幻觉现象并没有消失,使得医疗或法律分析领域的公司在采用这些模型时面临困难。
最近在 《自然》上的一项研究也表明,语言模型的社交推理能力——能够理解人们在对话中真正的意思——依赖于极少量的模型特征,而微小的调整可能会破坏它们。这引发了关于可靠性的根本性问题。与此相关的是,OpenAI上个月承认,ChatGPT对弱势群体的保护措施在长时间对话中可能会失效。这一披露是在该机器人向一名青少年提供自残指示后做出的。
李飞飞(@drfeifei)谈论大型语言模型的局限性。“自然界中没有语言。你不会在自然界中看到天空中写着的字.. 这是一个遵循物理法则的三维世界。”语言纯粹是生成的信号。pic.twitter.com/FOomRpGTad
— 罗汉·保罗 (@rohanpaul_ai) 2025年9月9日
一些科技界更直言不讳的人士指出了其中的缺陷。“硅谷在过度炒作大型语言模型方面完全搞砸了,”Palantir Technologies Inc. 首席执行官亚历克斯·卡普 在其人工智能会议上说。Meta Platforms Inc. 的首席人工智能科学家扬·勒昆长期以来一直认为,大型语言模型是更智能机器的“死胡同”,因为它们无法理解其物理环境或进行前瞻性规划。它们只是“令牌生成器,” 他警告说。
大型语言模型不会消失,但市场历史表明,迷恋单一解决方案的危险。投资者和企业应该保持警惕,关注技术突破,并准备好应对变化。在技术领域,这种变化可以——而且往往会——在任何人预料之前发生。
来自彭博社观点的更多内容:
- 人工智能 盈利之路 正在被消费者推动:帕米·奥尔森
- 谷歌正在 尝试一切 向怀疑者推销人工智能:戴夫·李
- 网球 人工智能造假 正在困扰美国公开赛:霍华德·蔡-欧安
想要更多彭博社观点? OPIN <GO>****。或者您可以订阅 我们的每日通讯**。**