AI正在辅导学生,但仍在基础数学上挣扎——《华尔街日报》
Matt Barnum
Khanmigo人工智能工具有时对算术问题的答案并不确定。插图:Parker Eshelman/WSJ, Khan Academy, iStock (2)在ChatGPT公开发布仅几个月后,教育家萨尔·可汗在一次广受关注的TED演讲中提出了一个引人深思的观点:“我们正处在利用AI实现教育史上最重大积极变革的边缘。”
他表示,这将通过“为地球上的每位学生配备一位人工智能驱动的卓越个人导师”来实现。
可汗的教育非营利组织可汗学院开发了一款名为Khanmigo的AI辅导机器人。但目前,一个重大障碍可能限制Khanmigo及类似工具作为成功导师的应用:基于大型语言模型的AI在数学方面表现欠佳。
“让ChatGPT做数学题有点像让金鱼骑自行车——这根本不是ChatGPT的强项,”研究AI的耶鲁大学教授汤姆·麦考伊说,“它经常出错,我们实在不该感到惊讶。”
当《华尔街日报》记者测试由ChatGPT驱动的Khanmigo时,这一挑战显而易见。Khanmigo频繁犯下基础算术错误,比如343减17这样的减法题计算错误。它也无法始终如一地掌握四舍五入或平方根计算的方法。通常,当被要求复核答案时,Khanmigo不会纠正错误。
《华尔街日报》测试期间,Khanmigo确认数学题错误答案的示例。该技术仍在发展中,可汗学院发言人表示本周已进行升级以提高Khanmigo的准确性。
但某些错误可能持续存在,随着Khanmigo的推广,该机构将继续向师生强调其不完美性。“我们会把这一点放在更醒目的位置,“萨尔·可汗在接受采访时表示。
开发ChatGPT的OpenAI公司发言人拒绝了采访请求,也未回应详细问题清单。
可汗学院因其每年数百万观看量的教育视频被众多师生熟知。目前Khanmigo正在44个学区的约6.5万名学生中试点。
可汗预计下学年将有100至200万学生使用该产品,学校采购价为每生35美元。其他公司也在推广AI家教系统,部分政策制定者和科技高管对其潜力充满热情。这一扩张举措正值教育工作者寻求低成本方案应对持续的疫情时代学习损失。
与ChatGPT类似,Khanmigo通过聊天形式回应用户提问。不同之处在于其训练目标不是直接给出答案,而是引导学生逐步解决问题。它为三年级及以上学生提供数学、语言艺术、历史和科学辅导,可批改作文、模拟文学角色对话并探讨时事议题。
在测试该产品时,《华尔街日报》请Khanmigo帮忙计算一个直角三角形第三边的长度,这是八年级数学中学生们可能会遇到的问题。
Khanmigo正确地识别出了勾股定理,a2 + b2 = c2,作为找到答案的关键。当被问及解决方案时,机器人给出了诸如“我在这里是为了帮助你学习,而不仅仅是提供答案!”这样的回答。
但Khanmigo在数学运算上遇到了困难。当试图解决一个斜边为27单位、一边为17的直角三角形时,一名记者给出了272减去172的错误答案(430而不是440)。“太棒了!”Khanmigo回应道。后来,它接受了440的平方根的错误答案。
在另一个例子中,Khanmigo自己构造了一个斜边为15单位、一条直角边为9的三角形问题。但当一名记者正确地说出152减去92等于144时,Khanmigo却暗示这个回答是错误的。“我明白你的意思,但让我们再来看一下这个减法,”它说。
Khanmigo的困境并不让AI研究人员感到意外。数学是大型语言模型面临的著名挑战,这些模型使用大量数据和复杂的统计模型来根据提示生成基于文本的回应。
亚利桑那州立大学的计算机科学家保罗·沙卡里安表示,它对数学问题的回应类似于通过闪卡记忆答案,而不是学习数学过程。这使得它容易出错,特别是对于新颖的问题。
“它还没有学会像你我一样解决数学问题,”沙卡里安说。
SchoolAI的首席执行官兼联合创始人卡莱布·希克斯表示,该产品有时会算错数学答案。该公司最近与犹他州一个学区签约,为基于人工智能的辅导和其他项目提供支持。“这是整个行业都在努力改进的领域,”他说。希克斯称这项技术仍有助于学生学习数学概念,并且会不断进步。
研究人员认为人工智能的数学能力很可能会提升。但进展可能并非线性,因为改进一个维度可能会在其他领域带来挑战。
可汗表示,尽管Khanmigo在数学方面存在不足,但它为教师和学生提供了广泛帮助。“我们不因追求完美而忽视现有的价值,”他说。
佛罗里达州棕榈滩县的高中教师伊娜·罗森塔尔是该试点地区的教师之一,她表示已发掘Khanmigo的多种用途。该工具不仅协助她设计数学课程,还被用于批判性思维课程的辩论功能。
在代数2课堂上,当学生难以理解概念而罗森塔尔无法一对一辅导时,她会让学生使用Khanmigo。她表示准确性并未影响工具的实用性,但会提醒学生Khanmigo偶尔会出错。
“我们被告知它仍在学习过程中,”她说。
联系马特·巴纳姆请致信[email protected]