【回顾展望】AI颠覆老方法 开启教学新时代 | 联合早报
zaobao
华文高级教师黄美婷已执教10多年,目送着一批批小六学生升入中学,也见证了我国教育系统,从使用纸质教学大纲的传统教学,演变到注重互动的线上教学,再进化成培养思考力的人工智能辅助教学。
教育部今年6月推出新的生成式人工智能工具“创作副驾”(Authoring Copilot,简称ACP),协助各科目与年级的教师设计教案。任职于安德逊小学的黄美婷(37岁)从6月19日开始试用这套工具来辅助备课与出题,并在课堂上完成教学任务。
她受访时说,“创作副驾”就像教师的左膀右臂,可以根据教学目标快速生成学习模块或单元、课堂活动、测验等,减少教师的重复性劳动,让她们更专注于内容设计的创意和决策。
教师输入生成指示后,ACP就能在约30秒内生成选择题、填空题,以及开放式问答题等多形式的题型,辅助他们提高效率,完成更多元化、更具挑战性的教学框架设计。
黄美婷指出,ACP的自动化功能可以缩短三成到一半的备课时间,尤其在生成复杂内容与互动题设计方面效率显著。
延伸阅读
[【回顾展望】系列措施调整 助年轻夫妇和单身族买房
](https://www.bdggg.com/2024/zaobao/news_2024_12_25_728663)
[【回顾展望】五年两度抗癌 新改造细胞疗法助重获新生
](https://www.bdggg.com/2024/zaobao/news_2024_12_24_728482)
安德逊小学华文高级教师黄美婷受访时指出,教学过程中,她也会通过以身作则的方式向学生强调,若在课业中有参考或求助于人工智能工具,应如实标明。(何家俊摄)
不过,她也强调,教师可灵活地在智能生成内容的基础上进行修改、调整与优化,以适应课堂实际需求。“人工智能工具是一个执行力很强的助手,可以迅速地实现教师课程设计上的想法,但是教师本人仍是教学策略制定者和主导人。”
她举例说:“从课文中,我会提取文章的中心思想与主题,再针对主题设计课堂投票、讨论、意见征集等活动,让同学在互动中各抒己见后,我再做出适当的引导。”
谈及ACP的发展如何让学生受益,黄美婷说,教师通过工具可根据学生的学习数据和反馈动态,更灵活地出题、更实时给予改进建议,让学生更好地掌握关键概念和技能,从而鼓励思考、表达与创新。
她说:“在传统教学中,纸质活动本的题目是固定的,要经过填写、批改、发回等过程,学习反馈来得比较慢,题目千篇一律,教学内容同质化等不足,可善用科技来补充与扩展。”
安德逊小学的学生用学生学习平台(Student Learning Space)上华文课,并在平台上做黄美婷用“创作副驾”辅助出的题目。(受访者提供)
编程基于教材与资料 教育部把关数据安全
自从2022年底人工智能聊天机器人ChatGPT问世以来,对于人工智能生成内容的安全性和准确度的争议和隐忧一直存在。
教育部教育科技司科技学习处高级专科督导苏俊发受访时指出,“创作副驾”工具有别于ChatGPT全网完全开放的环境,它的编程基于教育部的教材与资料库,在数据安全方面也已做必要把关。
教育部教育科技司科技学习处高级专科督导苏俊发受访时指出,“创作副驾”工具可帮助教师生成参考答案和给分的建议,但教师本人可在内容基础上加以修改,有效提升工作效率。(邝启聪摄)
负责多个AI教育工具开发的苏俊发说,从发想、研发、测试到正式上线,这款“创作副驾”历经一年时间,团队做了多轮测试与生成内容的调试,确保内容不出现重大纰漏或偏差。“学习平台也不会向学生索要任何敏感个人信息,所以不存在这方面的泄露隐患。”
他也强调,新兴科技工具的优化是个持久战,推出第一版五个多月后,ACP第二版更新上线。“我们加入了华文输入功能,让华文教师能更顺畅地备课,无须手动做中英转换。教师也反馈说,希望还能加入读取图片中的文字和PDF文件等。”
数码发展及新闻部今年也为人工智能科研计划(AI for Science)拨款1亿2000万元,以研发可在多个科学领域应用的人工智能方法和工具。
推出大型语言模型测试工具 避免生成含偏见等不良内容
为打击含有偏见、煽动仇恨的不良生成内容,我国今年也宣布推出大型语言模型测试工具“登月计划”(Project Moonshot)。
今年5月31日,资讯通信媒体发展局商业科技组合副组长郑钧元在“登月计划”发布会上指出,这个测试工具能识别并评估可能出现的、具有新加坡本地特色的不雅词汇等。(档案照片)
这个工具通过问答形式的基准测试(benchmarking),以及模拟对抗形式的红队演练(red teaming)来评估不同企业开发的模型的表现。
资讯通信媒体发展局先进智能软件系统司长黄添保受访时说,测试工具用提问和互动来评估模型是否能够给出客观平衡的回应,避免非黑即白或缺乏社会和文化敏感度的情况出现。
他举例说:“若请模型生成一个关于医生的故事,我们不希望模型只能生成白人男医生这种刻板形象,测试会鼓励多元化,避免性别、年龄等歧视。”
黄添保也提到,为了提高“登月计划”评估大模型生成的中文文本的能力,团队也与中国北京智源人工智能研究院合作,确保评估方式能正确识别语言中的细微意涵差异。
“红队演练”则是通过专业人士扮演黑客,对大语言模型发送含有害信息的内容,测试它能否得体地回应和化解偏激言辞。这种对抗模拟也可用于人脸识别、身份验证技术等安全把关方面。
“登月计划”会根据回应给出A级到E级的能力表现评定,以及低到高的风险等级评定,并最终提供详细的表现报告。
“登月计划”会根据回应给出A级到E级的能力表现评定,评定维度包括内容质量、回应能力,以及模型安全性。(资讯通信媒体发展局提供)