《华尔街日报》：ChatGPT帮我写了AP英语论文——我通过了

Joanna Stern

2022-12-21

看吧，高中时代的我可是诚实与勤奋的典范。从不作弊——除非你把任天堂游戏作弊码也算上。

但这个月，我以资深作弊者的身份重返高中校园。确切地说，是ChatGPT作弊者。

如果你还没尝试过ChatGPT，这款OpenAI推出的新人工智能聊天机器人会让你大开眼界。无论是让机器人写封给老板的道歉邮件，还是关于世界首富仓鼠的文章，抑或是设定在2022年的《宋飞正传》剧本——它都能生成让你以为是人类撰写的文本。主题知识、正确标点、多样句式、清晰结构，一应俱全。

你还可以让它写一篇500字关于《了不起的盖茨比》或西班牙宗教裁判所的论文。于是我做了任何自虐型科技记者都会做的事：效仿《超龄插班生》重返校园。我想测试这个技术奇迹的能力与局限——它正蓄势颠覆全球学生的考试方式和教师的评分体系。

起初我打算回到初中校园的走廊和青春痘岁月。但当我把ChatGPT生成的作文拿给七年级写作老师看时，她立即识破了这是伪造的——文笔词汇都太过老练。

于是我转向了十二年级的大学预科文学课。

迈克尔·戴蒙德是新泽西州锡考克斯市高科技高中的AP文学教师，他允许乔安娜·斯特恩和ChatGPT当天进入他的课堂。照片：肯尼·瓦苏斯/华尔街日报新泽西州锡考克斯市高科技高中的英语教师迈克尔·戴蒙德欢迎了我和我的AI替身。他已经用ChatGPT尝试过自己的论文作业。

那么我得了A吗？并不完全是。

测试1：提交作业

以下是戴蒙德老师作业的简短版本：

“写一篇500到1000字的文章，论证《春天不是读书天》是一部存在主义文本。使用课堂材料中的具体证据，并明确比较或联系《春天不是读书天》和弗兰兹·卡夫卡的《变形记》中的人物、背景和/或主题。”

1986年约翰·休斯的经典电影？没问题。我从小就用梳子当麦克风唱《Twist and Shout》，假装沙发在芝加哥的街道上漂浮。但弗兰兹·卡夫卡关于一个人醒来变成虫子的中篇小说？我几乎立刻就把它抛在脑后了。

我把作业粘贴到chat.openai.com，按回车键，看着机器人打出400个字，然后给我一个“网络错误”。太好了，离截止时间还有一个小时，我的AI代笔却在打盹。

一分钟内，ChatGPT就生成了这篇800字的文章，论证《春天不是读书天》是一部存在主义文本。图片来源：乔安娜·斯特恩/华尔街日报OpenAI女发言人表示，该系统一直面临需求压力，公司正在努力扩大其规模。

终于成功了。我将这篇800字的文章粘贴到文档中，询问ChatGPT如何格式化高中AP论文（双倍行距，12号Times New Roman字体，段落缩进），在顶部写上我的名字，然后通过电子邮件发送给戴蒙德先生。我还附上了一张便条：

“我写这封信是为了为我的论文迟交道歉。我知道您对截止日期有特定的期望，很抱歉我没有达到这些要求。”

当然，这张便条也是ChatGPT写的。戴蒙德先生在几分钟内回复道：

“亲爱的乔安娜，我想通知您我已收到您的作业，感谢您花时间完成它。然而，它是在截止日期之后提交的，因此将被标记为迟交。”

当然，他也使用了ChatGPT。

测试2：撰写论文

我对我的论文印象深刻。它将卡夫卡的格里高尔·萨姆沙与菲利斯·布勒进行了类比。文章组织得很好，但丝毫没有机械的精确感。（您可以在此处阅读完整论文。）

正如您在我的视频中看到的，戴蒙德先生并不那么印象深刻。虽然他称赞我的文章迅速提出了论点，但开篇段落有一个事实错误。我引用了菲利斯在电影开头说的话，他说他“不会坐在那里，让影响他的事件决定他的人生进程。”但这句话实际上是菲利斯的搭档卡梅伦说的，而且是在电影结尾处，就在著名的法拉利坠落之前。

亲爱的ChatGPT，卡梅伦在左边，费里斯在右边。照片：派拉蒙影业/CBS/盖蒂图片社戴蒙德先生还发现了其他错误。我的论文说费里斯性格内敛，很少出现在同伴身边。（这又是卡梅伦的特点。）文中称《变形记》的故事背景设定在郊区。（实际发生在一个未命名的城市。）

这份作业六道题中我只答对了三道，根据AP评分标准，相当于B-到C的水平。虽然及格了，但远未达到我的标准。

“从整体写作质量来看，你处于班级后30%的位置，“戴蒙德先生告诉我，“你可能具备理解能力，但需要提升写作技巧。“他说我的文章"呆板”，“缺乏活力和个人风格”。（我的真实编辑们或许有千般理由批评我——但这绝对不在其中！）

当我询问他是否怀疑这是AI所写时，他表示不会。尽管熟悉学生的写作风格，但批改60多篇论文时，这种结构合理、直切主题的作文并不会触发警觉。

迈克尔·戴蒙德在笔记本电脑上批改AI生成的论文时，指出了多处事实性错误。照片：肯尼·瓦索斯/华尔街日报戴蒙德先生无法通过谷歌课堂的抄袭检查器审核我的文章，因为我不是注册学生。当我使用写作辅助工具Grammarly（可改进语法并检测抄袭）检查时，仅少数常见短语被标记为可疑。这确实是原创文本——只不过是由机器人撰写的。

谷歌课堂和为学校提供抄袭检测工具的Turnitin公司利用人工智能将学生作业与其既往作业进行比对。Turnitin人工智能副总裁埃里克·王表示，这有助于教师识别新的ChatGPT作弊行为。他还告诉我，该公司能通过人类无法察觉的线索检测AI生成文本，并将在2023年新增AI写作检测功能。

OpenAI发言人表示，ChatGPT的开发公司也正在探索和研究更便捷的AI写作识别方案。

测试3：参与小组讨论

最终测试：验证ChatGPT能否让我在未阅读材料的情况下参与小组讨论。本次测试选用丹尼斯·约翰逊短篇小说集《耶稣之子》中的《搭车时的车祸》。

当同学们迅速展开关于故事人物的讨论时，ChatGPT却让我陷入窘境：

“我没有关于名为《搭便车时遭遇车祸》的书籍或电影的任何信息。”

乔安娜在小组讨论中尝试使用ChatGPT时，她的同学们对她的贡献并不满意。图片来源：肯尼·瓦苏斯/华尔街日报当我搜索这本书名时，机器人给了我一些勉强有用的信息，但犯了一个大错：主角的名字。最后，一位人类学生给了我一个清晰的剧情概要。

总体而言，戴蒙德先生给我和ChatGPT打了C分。就连OpenAI的首席执行官萨姆·奥尔特曼也表示，目前它对任何重要事情都不可靠，需要在“稳健性和真实性”方面进行改进。但多位AI专家告诉我，准确性和数据将迅速提升。当那一天到来时，我们将拥有相当于科学计算器的写作工具。

不过，它也不太可能取代在纸上写字这种时而艰苦、时而有趣的任务。“未来的赢家将是AI与人类之间这种艺术性的互动，”专注于AI与教育的北卡罗来纳州立大学计算机科学教授詹姆斯·莱斯特告诉我。

OpenAI的ChatGPT可以用来给老板写邮件或帮你找到披萨食谱——它也能写出一篇相当不错的高中作文。照片：肯尼·瓦苏斯/华尔街日报我的一些新高中朋友告诉我，他们使用诸如Grammarly这样的AI工具来改进标点符号和词汇选择。戴蒙德先生已经在考虑如何将ChatGPT融入他的课程中。此外，我还用ChatGPT帮助生成本专栏的一些内容想法。

只有一件事我一直想知道：ChatGPT能否帮助费里斯度过一个更成功的休息日？（ChatGPT的回答是肯定的。）

在此订阅《乔安娜·斯特恩的科技事物》**，一份新的每周通讯。现在一切都是科技事物。专栏作家乔安娜·斯特恩将作为您的向导，分析并回答您关于这个永远互联的世界的问题。

写信给乔安娜·斯特恩：[email protected]

刊登于2022年12月22日的印刷版，标题为《ChatGPT写了我的AP论文——我还及格了》。