《华尔街日报》:堆叠箱子?治疗癌症?AI需先学习物理学
Christopher Mims
过去一年,人工智能以其惊艳表现令世界瞩目,很大程度上归功于像ChatGPT这样能与用户流畅对话的大型语言模型。但这类AI在应对机器人学、科学与工程领域的复杂问题时仍力有不逮。
要实现突破,AI必须掌握物理学原理。
让AI在现实世界中发挥作用,可以延长电动汽车续航里程、优化癌症患者护理方案,还能接手原本仅由人类完成的工作。但构建此类系统极具挑战,因为它既需要特定领域的专业知识,又要求精通机器学习技术。
采用这种方法的研发者表示,其成果绝对值得投入。毕竟,从已知世界规律出发本就是科学家和工程师的思维方式。
这种方法有多个名称,如"物理信息神经网络"或"科学机器学习",但核心思想一致:为AI提供认知起点。这个起点就是我们通过数十年甚至数百年实践积累的关于桥梁、电池等系统的知识体系。该框架能有效缩小AI需要探索的解决方案空间,使其更快做出有效预测。
“就像有人走迷宫时,你提前标出了死路。“布朗大学机器学习研究组负责人卡里安·伯根这样比喻。
假设要训练AI控制机器人行走。敏捷机器人公司首席机器人官乔纳森·赫斯特指出,初期学习必须在仿真环境中进行,这比实体机器人训练更高效且成本更低。(亚马逊近期宣布将在其仓库测试的双足机器人正是由敏捷公司研发。)
Agility Robotics公司研发的双足机器人将在亚马逊某仓库进行测试。图片来源:亚马逊当物理基本定律已内置时,机器学习算法在指导机器人行走时需探索的肢体与身体运动可能组合会大幅减少。若模拟环境未遵循这些定律,AI可能得出看似"正确"实则荒谬的解决方案,例如穿透固体或误解重力作用。
AI处理的问题范围越精准,其表现越出色——这一理念在为人类和企业创造可量化价值的AI系统中普遍适用。而本例中的约束条件,正是自然界的物理法则。
德克萨斯大学奥斯汀分校奥登计算工程与科学研究所所长Karen Willcox指出,融入物理知识的机器学习系统进行预测时所需数据量,远少于对现实世界缺乏认知的AI系统。
她以喷气发动机"数字孪生体"为例说明。通用电气等公司长期运用这种结合机器学习的模型来预测发动机维护时机。如今随着算力提升和新型机器学习算法普及,这种物理约束方法正得到更广泛应用。(Willcox关于该主题的TED演讲极具启发性。)
采用同样的方法——结合对自然界的认知、持续收集的数据以及机器学习——理论上可以创建癌症患者的数字孪生体来指导治疗,她补充道。这是威尔科克斯研究小组与MD安德森癌症中心合作正在研究的方向。目前,该团队仅在"计算机模拟"中——即基于代表性患者数据池——测试了该方法,但他们正在讨论可能的临床试验。
在完全电动化的F1赛事Formula E中,电池剩余能量管理是胜负的关键。为Formula E赛车制造电池的WAE科技公司最近成立了Elysia部门,将其基于物理信息神经网络的电池管理软件商业化。
Elysia的系统能以远少于常规需求的数据量确定电池状态,因为这些AI已深度"掌握"电池工作原理。工程师因此能更接近电池极限使用,在不造成损害的前提下榨取更多电力。Elysia技术负责人Tim Engstrom表示,这将提升现有电动车(包括您车道上那辆)的续航里程。
事实证明,教机器人卸货比教它们装货更容易。德克斯特瑞公司的这些机器人在装载环节取得了重大进展。图片来源:德克斯特瑞机器人公司德克斯特瑞正将机器学习与现实中箱子行为的模型相结合,以创造出最终能够装载卡车的机器人。(从卡车上卸货这一更简单的问题已率先解决。)该公司首席执行官萨米尔·梅农表示,如果没有这些模型,堆叠箱子几乎是不可能完成的任务,因为现实世界中的物体并不总是以理想化的方式运动。它们的重量可能比机器人预期的更轻或更重,内部物品可能发生位移,被放置到位后还可能产生沉降。他补充说,要应对现实世界中所有这些异常情况,需要建立相当精准的模型。
针对本文采访的专家表示,将物理学原理融入机器学习的方法仍处于早期阶段。伯根指出,科学家们对其他形式人工智能的炒作持谨慎态度——比如目前大热的聊天机器人和艺术生成模型。但她同时表示,科学机器学习的潜力令人振奋,其核心在于能帮助人们获得对系统的新认知,尤其是在我们尚未完全理解这些系统时。
欲获取更多《华尔街日报》科技分析、评论、建议及头条新闻,请订阅我们的每周简报。
写信给克里斯托弗·米姆斯,邮箱:[email protected]
刊登于2023年10月28日印刷版,标题为《搬运箱子?治疗癌症?AI首先需要学习物理》。