【回顾展望】AI颠覆老方法开启教学新时代 | 联合早报

华文高级教师黄美婷已执教10多年，目送着一批批小六学生升入中学，也见证了我国教育系统，从使用纸质教学大纲的传统教学，演变到注重互动的线上教学，再进化成培养思考力的人工智能辅助教学。

【回顾展望】AI颠覆老方法开启教学新时代 | 联合早报

zaobao

2024-12-27

华文高级教师黄美婷已执教10多年，目送着一批批小六学生升入中学，也见证了我国教育系统，从使用纸质教学大纲的传统教学，演变到注重互动的线上教学，再进化成培养思考力的人工智能辅助教学。

教育部今年6月推出新的生成式人工智能工具“创作副驾”（Authoring Copilot，简称ACP），协助各科目与年级的教师设计教案。任职于安德逊小学的黄美婷（37岁）从6月19日开始试用这套工具来辅助备课与出题，并在课堂上完成教学任务。

她受访时说，“创作副驾”就像教师的左膀右臂，可以根据教学目标快速生成学习模块或单元、课堂活动、测验等，减少教师的重复性劳动，让她们更专注于内容设计的创意和决策。

教师输入生成指示后，ACP就能在约30秒内生成选择题、填空题，以及开放式问答题等多形式的题型，辅助他们提高效率，完成更多元化、更具挑战性的教学框架设计。

黄美婷指出，ACP的自动化功能可以缩短三成到一半的备课时间，尤其在生成复杂内容与互动题设计方面效率显著。

延伸阅读

[【回顾展望】系列措施调整助年轻夫妇和单身族买房

](https://www.bdggg.com/2024/zaobao/news_2024_12_25_728663) [【回顾展望】五年两度抗癌新改造细胞疗法助重获新生

](https://www.bdggg.com/2024/zaobao/news_2024_12_24_728482) 安德逊小学华文高级教师黄美婷受访时指出，教学过程中，她也会通过以身作则的方式向学生强调，若在课业中有参考或求助于人工智能工具，应如实标明。（何家俊摄）

不过，她也强调，教师可灵活地在智能生成内容的基础上进行修改、调整与优化，以适应课堂实际需求。“人工智能工具是一个执行力很强的助手，可以迅速地实现教师课程设计上的想法，但是教师本人仍是教学策略制定者和主导人。”

她举例说：“从课文中，我会提取文章的中心思想与主题，再针对主题设计课堂投票、讨论、意见征集等活动，让同学在互动中各抒己见后，我再做出适当的引导。”

谈及ACP的发展如何让学生受益，黄美婷说，教师通过工具可根据学生的学习数据和反馈动态，更灵活地出题、更实时给予改进建议，让学生更好地掌握关键概念和技能，从而鼓励思考、表达与创新。

她说：“在传统教学中，纸质活动本的题目是固定的，要经过填写、批改、发回等过程，学习反馈来得比较慢，题目千篇一律，教学内容同质化等不足，可善用科技来补充与扩展。”

安德逊小学的学生用学生学习平台（Student Learning Space）上华文课，并在平台上做黄美婷用“创作副驾”辅助出的题目。（受访者提供）

编程基于教材与资料教育部把关数据安全

自从2022年底人工智能聊天机器人ChatGPT问世以来，对于人工智能生成内容的安全性和准确度的争议和隐忧一直存在。

教育部教育科技司科技学习处高级专科督导苏俊发受访时指出，“创作副驾”工具有别于ChatGPT全网完全开放的环境，它的编程基于教育部的教材与资料库，在数据安全方面也已做必要把关。

教育部教育科技司科技学习处高级专科督导苏俊发受访时指出，“创作副驾”工具可帮助教师生成参考答案和给分的建议，但教师本人可在内容基础上加以修改，有效提升工作效率。（邝启聪摄）

负责多个AI教育工具开发的苏俊发说，从发想、研发、测试到正式上线，这款“创作副驾”历经一年时间，团队做了多轮测试与生成内容的调试，确保内容不出现重大纰漏或偏差。“学习平台也不会向学生索要任何敏感个人信息，所以不存在这方面的泄露隐患。”

他也强调，新兴科技工具的优化是个持久战，推出第一版五个多月后，ACP第二版更新上线。“我们加入了华文输入功能，让华文教师能更顺畅地备课，无须手动做中英转换。教师也反馈说，希望还能加入读取图片中的文字和PDF文件等。”

数码发展及新闻部今年也为人工智能科研计划（AI for Science）拨款1亿2000万元，以研发可在多个科学领域应用的人工智能方法和工具。

推出大型语言模型测试工具避免生成含偏见等不良内容

为打击含有偏见、煽动仇恨的不良生成内容，我国今年也宣布推出大型语言模型测试工具“登月计划”（Project Moonshot）。

今年5月31日，资讯通信媒体发展局商业科技组合副组长郑钧元在“登月计划”发布会上指出，这个测试工具能识别并评估可能出现的、具有新加坡本地特色的不雅词汇等。（档案照片）

这个工具通过问答形式的基准测试（benchmarking），以及模拟对抗形式的红队演练（red teaming）来评估不同企业开发的模型的表现。

资讯通信媒体发展局先进智能软件系统司长黄添保受访时说，测试工具用提问和互动来评估模型是否能够给出客观平衡的回应，避免非黑即白或缺乏社会和文化敏感度的情况出现。

他举例说：“若请模型生成一个关于医生的故事，我们不希望模型只能生成白人男医生这种刻板形象，测试会鼓励多元化，避免性别、年龄等歧视。”

黄添保也提到，为了提高“登月计划”评估大模型生成的中文文本的能力，团队也与中国北京智源人工智能研究院合作，确保评估方式能正确识别语言中的细微意涵差异。

“红队演练”则是通过专业人士扮演黑客，对大语言模型发送含有害信息的内容，测试它能否得体地回应和化解偏激言辞。这种对抗模拟也可用于人脸识别、身份验证技术等安全把关方面。

“登月计划”会根据回应给出A级到E级的能力表现评定，以及低到高的风险等级评定，并最终提供详细的表现报告。

“登月计划”会根据回应给出A级到E级的能力表现评定，评定维度包括内容质量、回应能力，以及模型安全性。（资讯通信媒体发展局提供）