大学重新考虑使用AI写作检测器来审核学生的作业 - 彭博社

Shirin Ghaffary

2023-09-22

几所重要的大学已经关闭了AI检测软件，理由是担心准确性，并害怕错误地指控学生使用AI作弊。

摄影师：Christian Petersen/Getty Images嗨，我是Shirin，在旧金山。我在这里为您带来Q&AI的第三期，这是我们每周的新闻分析、内幕见解和对您问题的回答（请发送至这里！）关于快速发展且常常令人困惑的AI世界。

在ChatGPT去年火了之后，一些老师依赖AI写作检测工具来判断他们学生的作业是否借助人工智能编写。现在一些大学因为担心准确性而重新考虑使用这些服务。但首先…

三件事要知道：

• Nvidia的CEO 押注印度成为顶级AI市场，并可能成为对抗中国风险的对冲• 微软正在推出生成式AI 到其Windows和Office应用中• AI初创公司Corti 筹集了6000万美元来挑战微软在医疗保健领域

不及格

当ChatGPT在去年11月发布时，我记得我最初的想法之一是：“这在大学时节省了我很多时间。” 显然许多人也有同样的想法。ChatGPT对学生如此受欢迎，以至于其流量似乎随着学校日历的变化而波动，正如我本周早些时候报道的。

这为担心学生让聊天机器人代写作业的老师们带来了独特的挑战。在ChatGPT火起来后的头几个月，一些教育工作者开始使用AI检测工具，这些工具声称可以识别作业是由人类还是AI写的。但这些选项并没有像一些学校希望的那样有效。

最近几个月，包括范德堡大学、密歇根州立大学、西北大学和德克萨斯大学奥斯汀分校在内的几所重要大学已经关闭了由Turnitin公司提供的AI检测软件，根据公开文章和向彭博社提供的声明。他们担心准确性，并担心错误地指控学生使用AI作弊，这可能会毁掉他们的学术生涯。

“如果我们觉得它们足够准确，那么拥有这些工具将是很好的，”德克萨斯大学奥斯汀分校学术事务副校长阿特·马克曼说。“但我们不想制造出学生被错误指控的情况。”

Turnitin表示，误将写作标记为AI生成的错误率因任务而异。在评估整个文档是否为AI写作时，其误报率为1%，但在判断特定句子是否为AI生成时，误报率为4%。

这些百分比听起来可能很低，但如果将其放在大学每年提交的成千上万篇论文的背景下，这可能会导致很多被错误指控的学生。例如，范德堡大学在一篇博客文章中写道，去年有75000份学生论文提交给了Turnitin，该公司在推出AI选项之前就提供了防抄袭功能。如果打开了AI检测工具，博客文章称，可能会有750份学生论文被错误地标记为部分由AI撰写。Turnitin表示，教师不应仅依赖其软件来惩罚学生，大多数客户——使用其产品的机构中约98%——仍然启用了AI写作检测功能。

“在Turnitin，我们的指导是，并一直是，没有什么能替代了解学生、他们的写作风格和教育背景，”Turnitin首席产品官安妮·切奇泰利在一封电子邮件声明中说。“Turnitin的技术并不意味着取代教育工作者的专业判断。像Turnitin的AI写作检测功能这样指示AI写作存在的报告，只是提供数据点和资源，以支持与学生的对话，而不是确定不端行为。”

这种担忧不仅限于Turnitin。一项来自斯坦福大学的最近的研究发现，七个AI检测器错误地将超过一半由非英语为母语的学生写的论文标记为AI生成，而对于英语为母语者来说，结果“几乎完美”。Turnitin并未在该研究中进行测试。

OpenAI，ChatGPT背后的公司，在七月关闭了自己的AI检测器，因为发现其“准确率低”。在其网站上的文章中，OpenAI表示“没有一个”AI检测选项，包括自己的，“被证明能够可靠地区分AI生成和人类生成的内容”。

OpenAI表示已经吸收了反馈意见，并正在研究更有效的技术来识别由AI生成的文本、音频和图像。然而，目前老师们的选择有限。

正如学生不应过度依赖AI聊天机器人来完成他们的学业一样，老师们也不应让自动化服务充当学生作品的评判者、陪审员和执行者。那么，如果AI聊天机器人引发了一场作业末日，老师们该怎么办呢？

德克萨斯大学奥斯汀分校的Markman表示，学校正在鼓励教授与学生讨论他们对作业中使用AI的期望。该学校还将推出一个关注“有意识地追求学术”的新版本荣誉守则。

OpenAI发布了一套指南，供教师和学生了解如何使用ChatGPT来帮助学生学习。宾夕法尼亚大学沃顿商学院的教授伊桑·莫利克（Ethan Mollick）参与了这些指南的制定，他认为教师必须重新思考他们给学生的家庭作业。

“你可以开始接受其他类型的作业。你可以让家庭作业成为课堂讨论或课堂作文的准备，”莫利克说，他要求学生在每个项目中提交一份关于人工智能在帮助他们完成作业方面做得好和不好的反思。“我们会想出办法的。但现在，情况有点糟糕。”

Instagram联合创始人凯文·斯特罗姆（Kevin Systrom）在2019年奥斯汀西南偏南大会上的一个小组讨论中发言。摄影师：Callaghan O’Hare/Bloomberg不仅仅是教师们难以确定哪些内容是由人工智能编写的。凯文·斯特罗姆与他的大学同伴迈克·克里格（Mike Krieger）13年前共同创立了Instagram。现在，他们再次合作，推出了Artifact，一个个性化的人工智能驱动的新闻、应用评论、食谱和各种链接。

在本周的一次采访中，Systrom告诉我，“很难检测”由Artifact策划的文章是否是由AI生成的，但他并没有因此而失眠。“我更担心的不是‘这是机器人写的还是人类写的’，而是‘人类是否发现这个有用？’”他说。“我认为我们现在看到的绝大多数内容都是由人类创作的。”

这次采访已经过了编辑，以确保长度和清晰度。

Bloomberg：我注意到Artifact正在修改一些标题，使它们更具信息性而不是标题党。这是一种生成式AI功能吗？

**Systrom：**是的，绝大多数文章不受影响，但如果足够多的用户标记一篇文章为标题党，它将触发基本上对标题的重写。对于使用过的任何人，我们向其中一个这些生成式AI模型，这些大型语言模型，提供文章的基本信息，并解释它。然后我们要求它输出一个非常客观和直接的标题。我们发现这个方法非常有效。用户们真的很喜欢这个。

**人们对AI如何潜在地夺走记者的工作或者如何改变人们获取信息的方式感到焦虑。你认为AI对优质新闻的净影响会是什么？你认为它会伤害还是有益？**通常，当革命性技术出现时，每个人都关注技术将如何摧毁 - 摧毁工作，摧毁以前的用例。我认为历史上的模式是有些事情会发生，但并不像人们所说的那么痛苦… 是的，某些行业将变得不那么相关，但人们往往没有那么关注的是技术并没有摧毁，而是创造了巨大的机会和新公司的空间以及新的工作和新类型的工作。想想互联网。是的，它摧毁了我们购买产品的方式或者我们在哪里购买产品的方式或者我们如何消费信息的方式。同时，它给了我们各种各样令人惊叹的获取信息的方式。我现在可以购买一个产品，它在半天内就送到我家，或者如果是食物，30分钟内就送到我家。这些事情都有各种好处。一般来说，对于像AI这样的东西，我认为讨论需要适度。

这个想法是，人们所接收到的信息是基于AI认为他们最感兴趣的内容 - 你是否担心这可能会削弱人们自己的批判性思维能力或者他们自己决定要听谁的能力？

我认为人们仍然在很大程度上能够决定他们消费什么… 我实际上更担心的是把所有的AI推荐都归为一类，说它们都是一样的。事实并非如此。我想说的是，我认为大多数这样的系统都相当糟糕… 我认为许多这样的系统还没有完全弄清楚如何使推荐变得有价值和有意义；他们只是想出了如何插入那些点击率高的推荐。我不知道你是怎么想的，但是如果我上Twitter，我猜我们现在称它为X，像每四条插入的推文中就有一条是一些有趣的关于可爱动物的病毒视频。这与我对AI或技术的兴趣毫无关系。我们在创立Artifact时讨论的一件事是，我们希望利用AI推荐来产生价值，而不仅仅是让你盯着屏幕流口水。

马克·扎克伯格最近一直在谈论AI。他对这个领域的兴趣始于多久以前？当你在那里的时候，他对此非常关心吗？

他在关心增强现实和虚拟现实之前就关心AI了。他创建了FAIR - Facebook内部的研究实验室 - 专注于AI。当时的首席技术官Schrep [Mike Schroepfer]非常专注于建立这个组织，早在任何人谈论[VR]头盔之前。

所以我认为他和他们早期非常专注于这个问题，我相信他们有像Messenger内部的M这样的想法，那可能只是一个尝试或者太早了。但我的意思是，有多少公司做了一个想法，一个尝试或者太早，结果失败了呢？但如果你只是等上一两年 — 或者在这种情况下，也许是10年 — 这个想法最终会被证明是正确的。只是因为时机不对，你没有抓住它。顺便说一句，照片分享也是如此。

人工智能显然是Artifact的重要组成部分，但我很好奇你在日常生活中使用了哪些其他人工智能应用，特别是生成式人工智能工具？

ChatGPT是我的搭档。当我在进行人工智能编程时，我经常会对构建人工智能周围的一些非常详细的技术问题有疑问。起初，我并不认为ChatGPT能够提供帮助。结果发现，ChatGPT对人工智能的了解比我认识的任何人都多。所以我发现它对理解复杂的统计问题或者头脑风暴解决系统问题的方法非常有价值。

我还要说，我的孩子们喜欢ChatGPT，并不是因为你想的那样 — 而是因为ChatGPT编造了很棒的儿童故事。所以每天晚上睡觉时，我们会说，“好的，我们想让ChatGPT做什么？” — 关于一个故事。我儿子会说，“我想让它是关于一个红色的消防飞机的故事”，我女儿会说，“我想要一个美人鱼公主在故事中。” 所以我们设定背景然后说，“开始”，它就会创作出最奇幻的儿童睡前故事。他们真的很喜欢。

然后最后，只是因为我对一些图像生成的东西非常感兴趣，我建立了一个小型原型，允许您输入提示，说：“嘿，我想要这个东西的图像。” 我的女儿变得着迷，因为她一直想渲染不同种类的公主、场景或想象中的童话场景… 我认为一些人工智能工具对我的孩子们的创造力产生了即时而显著的影响，我认为这对未来非常有趣。

**对人工智能有问题吗？**给我发邮件，Shirin Ghaffary，我会尽量在未来的新闻简报中回答您的问题。

本周人类引用

“至少20年来，我一直试图说我不害怕机器，我不害怕计算机，我不认为机器人会接管。我认为那些玩具的人已经接管了。”

– 雷·布拉德伯里给《作家文摘》，1976年

问专家

OpenAI 计划在十月推出其图像生成工具Dall-E的下一个版本。这将有助于OpenAI在日益拥挤的AI图像生成领域保持竞争力吗？彭博社的人工智能记者Rachel Metz提供了她的看法：

很难在没有亲自尝试的情况下说它有多好（公司博客文章中的图像肯定是经过精心挑选的），但Dall-E 3看起来很有前途。它可能通过使得用更简单的提示获得更好看的图像变得更容易来解决一些更休闲用户对图像生成器的问题。其中一个预告图显示了一个鳄梨患者，果核通常在的地方有一个洞，正在和一个勺子治疗师交谈，说：“我只是觉得内心空虚。” 这表明它可能擅长生成文本，这常常困扰着AI图像生成器。

值得关注

亚马逊在生成人工智能时代保持Alexa的相关性。彭博社### 深度学习

乔治·R·R·马丁、乔迪·皮库特、乔治·桑德斯等知名作家加入了一项针对OpenAI的诉讼，指控他们的作品被用来开发AI工具
与此同时，科技公司正在聘请诗人和小说家撰写短篇故事，供其AI模型使用
谷歌正在将其Bard聊天机器人引入更多服务，包括Gmail、地图、文档和YouTube。YouTube正在推出AI生成的编辑工具，供其创作者使用，包括添加视频或图像背景的选项
印度演员安尼尔·卡普尔，出演了《贫民窟的百万富翁》，赢得了一场法律战斗。新德里法院下令禁止未经许可使用该演员的肖像制作AI生成内容
芯片设计公司Arm的股价本周下跌，因为伯恩斯坦贬低了该公司的AI前景

彭博社更多内容

获取科技日报以及更多彭博科技周刊直接发送到您的收件箱：

网络公告涵盖黑客和网络间谍的阴影世界
游戏进行中报道视频游戏业务
开机苹果独家报道，消费者科技新闻等
屏幕时间近距离观看好莱坞和硅谷的碰撞
声音片段报道播客、音乐行业和音频趋势