《华尔街日报》:顶尖人工智能如何模仿儿童
Alison Gopnik
心理学家艾莉森·高普尼克探索人性科学的新发现。阅读往期专栏请点击此处。
走过机场,你能生动地看到成人与儿童的区别。在视线平齐处,理智的成年人们正查看着起飞时间走向登机口。但低头望去,你会看到截然不同的人类:机场里的孩子们扭动游荡,四处奔跑,对着飞行器惊叹不已,摆弄每一张座椅。大人们或多或少耐心地照看着他们,避免惹出麻烦,最终将他们赶上飞机。
为何孩子如此奇特?他们的行为如此随机难测,如此无助又充满需求,却又能学到这么多东西。这种特质如何长远帮助他们变得更聪明?(这确实有效:在动物物种中,童年期越长大脑越大,而人类在这两方面都位居榜首。)
蒂宾根大学的安妮·吉隆与查利·吴及其同事在《自然·人类行为》期刊发表的新论文显示,令人惊讶的是,人工智能研究可能有助于解答这些问题。AI的进步依赖于机器学习,但在最有效的系统中,学习方式会随时间推移而变化。该论文揭示,这些变化与人类从儿童成长为成人过程中的心智变化惊人地相似。AI程序若以奇特孩童的方式起步再逐渐成熟,往往表现最佳。
AI系统可以有不同的“温度”。在物理世界中,温度越高分子运动越剧烈;而在数字世界中,“更高的温度”意味着更强的随机性。如果将ChatGPT的学习模块设置为“高温”,它的回答会更具创意,但也会更古怪和随机;而“低温”设置则会产生更合理但更平庸的回应。
哪种温度最理想?AI系统常采用所谓的“模拟退火”技术,类似于冶金中的物理退火过程。铁匠会将金属加热至红热状态,然后逐渐冷却以增强其韧性。AI算法最初会以“高温”状态进行广泛而随机的学习,尝试大量低概率可能性,随后逐渐“降温”并锁定最可能的选项。物理退火使金属更坚固;数字退火则有助于在创造性与合理性、探索与利用之间取得平衡。
机场里那些不守规矩的孩子们,他们的大脑似乎比成年人运行在“更高温”状态。我在自己的研究中提出,童年可能是进化实现模拟退火的方式。新论文中研究人员实质验证了这一观点:他们让281名5至55岁参与者完成相同任务——屏幕上显示64个方块的网格,每次翻开方块会获得标注的奖励。参与者有25次机会选择已翻过的方块或尝试新方块。相比成年人,儿童更倾向于探索新方块并尝试不同策略。
假设你将一个人工智能程序放入这个瓷砖世界。如果它只表现得像那些“热情”、更具探索性的孩子,就会浪费时间尝试不成功的策略。如果它仅像那些思维更狭窄、冷静的成年人一样行动,就学不到那么多东西。研究人员发现,如果AI开始时采用类似儿童的策略,然后逐渐转向成人策略,效果最佳。这种“随机优化”过程捕捉了人类随时间发展的方式。
我们需要从机场里那些疯狂的孩子开始,才能成长为高效、智慧的成年人。但当然,只有在大人们的照料下,孩子们才能茁壮成长。
更正与补充说明金属退火是一种缓慢冷却的过程,以使材料更具韧性。本文早期版本错误地将其描述为将加热的金属迅速浸入冷水中,这是一种名为淬火的快速工艺,会产生不同结果。(已于10月6日更正)
本文刊登于2023年10月7日的印刷版,标题为《最佳AI如何模仿儿童》。