人工智能“推理”模型将如何改变企业及经济格局——彭博社
Azeem Azhar
插图:Irene Suosalo为彭博社创作
人工智能将颠覆企业组织方式的传统认知(音频)
15:56
在历史长河中,雇佣十几位博士往往意味着巨额预算和数月的筹备期。如今,在聊天机器人中输入几个按键,就能在瞬间获得这样的智力资源。
随着智力资源变得愈发廉价和迅捷,支撑我们社会机构的基本假设——人类智慧稀缺且昂贵——已不再成立。当你可以随时高效咨询数十位专家时,这将改变企业的组织方式、我们的创新模式,以及每个人学习和决策的方式。个人和组织共同面临的问题是:当智力本身突然变得无处不在且几乎免费时,你将如何应对?
降低智力成本的历史沿革
这并非我们第一次见证知识与传播成本的革命性下降。15世纪中叶印刷术出现时,它大幅降低了文字材料的传播成本。在印刷术之前,文本需要由训练有素的修道士抄写员手工精心复制。
一旦这个瓶颈消失,欧洲经历了全面变革:宗教改革重塑了宗教信仰,识字率飙升(为基础教育铺平了道路),科学探索通过印刷论文蓬勃发展。这些变革的最大受益者是具有商业头脑的荷兰和英格兰,它们迎来了黄金时代——就英格兰而言,更赢得了数百年的全球领导地位。
随着时间的推移,大众识字率与公共教育相结合,使智力资源更加丰富,推动了工业化进程。工厂工作日益专业化,形成了复杂的劳动分工,促进了经济增长。18世纪末男性识字率较高的国家率先实现了工业化;到19世纪末,技术最先进的经济体也拥有识字率最高的人口。随着工人掌握新的技术技能,劳动力市场支持更专业化的职业,形成了持续至今的良性增长循环。
互联网通过大幅降低获取可靠信息的成本延续了这一趋势。在我小时候,研究一个新课题意味着带着主题清单步行去当地图书馆,这可能会耗费半天时间。那时,知识既不廉价也不容易获取。
如今,人工智能正在为这个延续千年的降低智力成本进程迈出下一步。这将成为我们经济和智力发展的下一篇章。
插图:Irene Suosalo为彭博社绘制### 我的ChatGPT顿悟时刻
2022年12月首次使用ChatGPT时,感觉像是一个里程碑。最初我的实验只是些数字小把戏——比如让人工智能"用埃米纳姆的风格重写《独立宣言》"(“哟,我们在此大声宣告,这群人绝不弯腰求饶”)。
回想起来,那就像让一位蓝带厨师去做烤奶酪三明治。直到2023年1月的一个下午,当我与12岁的女儿坐在一起时,我才开始意识到这些新工具的真正力量。在几个小时内,我们与ChatGPT合作设计了一款全新的棋盘游戏。
为了达到这个目的,我向我的AI助手介绍了我们喜欢和不喜欢的游戏,并要求它识别每种游戏的特点。它注意到我们喜欢具有某些特性的游戏——路径建设、资源管理、收集、战略规划——以及使最终胜利者不明确的动态。它还识别了我们不喜欢的那些在诸如《风险》和《大富翁》等游戏中常见的元素。
我让ChatGPT基于这些不太明显的特定元素提出游戏概念,并建议我想要一些历史题材的内容。于是《元素发现》这款游戏应运而生。玩家扮演18和19世纪的研究化学家,竞相发现新元素,收集和交易资源进行实验并得分。当然,玩家们也有能力互相破坏。
然后我要求AI更详细地描述资源、游戏玩法、游戏动态以及能让游戏更加生动的特定玩家角色。它提出了炼金术士、破坏者、商人和科学家等角色。它还确定了应该扮演这些角色的特定历史人物,如安托万·拉瓦锡、约瑟夫-路易·盖-吕萨克、玛丽·居里、卡尔·威廉·舍勒等。
仅仅两三个小时——使用一个非常基础的ChatGPT版本——我们就做出了一个粗糙但出奇可玩的游戏。我不得不停下来,部分原因是时间不够,部分原因是精疲力尽。这让我亲身体验到AI协作者如何将数周的研发压缩到几小时内。想象一下这对产品开发、市场分析甚至企业战略的影响。
我所经历的是一套似乎能进行高级推理的系统。ChatGPT不只是复述台词或 regurgitating 事实;它展示了类比和概念性思维,将想法与现实世界的参考联系起来,并按要求展示出真正的创造性问题解决能力。
从聪明鹦鹉到深度思考者
一万亿的任何东西都很多。难怪科学家最初被支撑ChatGPT的大语言模型弄得晕头转向。它们是极其复杂的软件机器,拥有100亿、5000亿甚至一万亿个参数。
而我们并不真正知道它们如何或为何工作。随着这些模型在过去七年中开始取得突破,一些理论家认为它们不能做任何新颖的事情——2021年学术研究人员创造的贬义词“随机鹦鹉”。学术研究人员 大语言模型通常通过基于训练数据中的统计模式预测文本块来生成响应,就像一只随机行为的鹦鹉(一种花哨的说法是概率性的)。
但对于我们这些不断被这些工具震撼的人来说,很难相信它们只是在复述它们所看到的东西。而在过去的六个月里,这似乎完全不可信。
早期的大型语言模型如同即兴射击,缺乏自我反思能力——或者说,对于没有自我意识的软件而言根本不存在这种概念。人类行为也类似:我们大多依赖快速直觉反应,即已故诺贝尔奖得主丹尼尔·卡尼曼所称的"第一系统思维"。但真正有价值的工作来自"第二系统思维",即有条理、审慎且有意识的过程——因而更不易出错。初代ChatGPT及其竞品都停留在第一系统层面。
直到去年九月,OpenAI推出革命性的o1推理模型。这种模型通过将复杂多步骤逻辑问题拆解为结构化步骤来解决问题。传统大语言模型在需要真正逻辑推理的任务中往往依赖记忆或表面模式匹配,而新型推理模型能分解问题、验证中间结论(必要时回溯)、并执行正确步骤得出最终答案。某些测试表明,推理模型展现出的智能水平堪比甚至超越特定领域的博士专家。
o1发布后的六个月里,技术取得巨大突破。当前最前沿的AI趋势(读者看到本文时仍将适用)是将这些推理模型转化为自主研究助手。这些系统的表现令人惊叹。
为辅助某项分析,我最近要求研究机器人对"F1赛事、科切拉音乐节、迪士尼乐园、拉斯维加斯赌场、医院、大型动物园等大规模活动及运营"进行环境影响评估。AI耗时73分钟调研29个独立信源,最终生成包含1,916字详细表格及注释的报告。质量虽非完美——约等于研究生数日工作的水准——但确实节省了我数日工作量。
就在18个月前,我的AI系统还在协助处理30分钟的任务。今非昔比。
认知生产线
我们见证了知识运用与脑力劳动方式的持续演进。从神庙秘典到早期文献,知识始终被守门人掌控。印刷术的出现使权力从僧侣学者的幽闭领域解放,走向民主化。互联网进一步推动这一进程——你可以假定每个联网者都拥有同等信息,挑战转而成为如何解读这些信息。如今,那些曾被视作罕见复杂的任务已变得触手可及——且成本低得惊人。
然而我与大企业高管交谈时,发现他们多在琐碎领域使用AI,与我交给AI处理的棘手问题相去甚远。起点往往是自动化客服以削减成本。Salesforce首席执行官去年12月表示,其每周3.6万次客户咨询中86%由AI客服处理。瑞典金融科技巨头Klarna通过AI处理三分之二客服对话,由此获得4000万美元利润。但仅靠削减10%客服成本难以改变企业格局,伟大公司从来不是靠节流建立的。
大多数企业在人工智能应用上起步较微,仅将每小时50美元成本的客服聊天等任务自动化——这固然实用,却远未触及变革核心。然而同样的AI平台本可攻克每小时价值5000美元的挑战:研发、战略规划或专业咨询。为何鲜有企业将其用于这些领域?
从某种层面看,人们难以想象那些委派给资深精英的高阶工作竟能被机器部分替代。“高价值任务"之所以珍贵,恰恰在于其执行者凤毛麟角。因此企业架构往往基于一个前提:真正卓越的智力资源始终稀缺。
以押注重磅药物的制药公司为例。其最大瓶颈在于能有多少新药通过耗时耗资的审批流程——单款药物上市需10-15年研发周期和超10亿美元投入,数千种候选化合物中往往仅有一种能最终面市。值得注意的是,大型药企的市场人员数量可能是顶尖科研人员的千倍之多,这正揭示了顶级专业人才的稀缺现状。
当前企业管理者对AI仍停留在"尝试采纳"而非"深信不疑"阶段。商界惯性地将某些难题视为解决成本过高而选择容忍,就像人们忍受隐隐作痛的背伤。当核心问题从"能否构想解决方案"转变为"多快能落地验证这些构想"时,这种权衡逻辑必将重塑。
其影响深远。当每个问题都能借助相当于数十位博士级专家的力量来解决时,创新速度将大幅提升。正如亨利·福特的装配线实现了汽车制造流程的快速迭代改进,人工智能使得创意和解决方案能持续优化升级。企业可以更快试错、加速学习并更高效地调整方向。
但若无法将这种卓越思考转化为实际行动,一切便失去意义。因此,成功的企业会找到方法落实其新型数字智囊团提出的建议。
我与AI共处的日子
过去18个月里,日益增多的AI系统支撑着我的工作。例如在2024年6月异常忙碌的一天,我调用了不同AI工具38次,往返处理了79,000字以辅助研究。
到2025年1月,我已放弃统计对话字数。但所有会议都有一个AI在做笔记(除非与会者反对)。多个研究工具定期提供协助。撰写本文当周,我向各类大语言模型提交了144余次查询,不包括26次转录记录或编程助手的使用。如今我对新兴AI应用的查询量已远超谷歌。
这项技术带来的意外收获是:我以更快的速度完成了更多工作——更令人欣喜的是,面对屏幕的时间反而比往年更少。
随着智能变得几乎免费,我们真正的限制不再是获取脑力,而是知道如何利用它。成功的组织和个人将懂得如何提出正确的问题,评估答案并明智地采取行动。他们还必须弄清楚如何利用新获得的空闲时间。
Azeem Azhar 撰写了《指数视野》通讯并投资于初创企业。