GPTZero 应用旨在阻止 ChatGPT、AI 在学校和在线媒体中的抄袭行为 - 彭博社

Diana Li

2023-05-09

与ChatGPT的对话。

摄影师：Nicolas Maeterlinck/AFP/Getty Images记者、编剧和大学教授等越来越多的人群担心最终会失去他们的生计，因为像ChatGPT这样的人工智能程序可以比人类更快地生成文本，可能还更好。但一位企业家正在开发技术，使区分人类撰写的文本和机器撰写的文本变得更容易。

Edward Tian，一位22岁的普林斯顿大学计算机科学和新闻学专业的学生，开发了一款名为GPTZero的应用程序，以阻止病毒聊天机器人ChatGPT在课堂上被滥用。自1月份以来，该应用已经吸引了120万注册用户。

他现在正在推出一个名为Origin的新项目，旨在“拯救新闻业”，通过区分在线媒体中由人工智能生成的虚假信息和事实。田已经获得了由Uncork Capital和Neo Capital共同领投的350万美元融资，技术投资者包括Stability AI Ltd首席执行官Emad Mostaque和Jack Altman。

GPTZero分析文本的随机性，称为困惑度，并分析文本中这种随机性的均匀性，称为爆发性，以识别AI的使用情况。据该公司称，该工具对人类文本的准确率为99%，对AI文本为85%。

这支由10人组成的团队现在希望赋予新闻业力量，并正在与像BBC这样的大型媒体组织以及包括纽约时报前首席执行官马克·汤普森在内的行业高管进行对话，讨论AI检测和分析的合作伙伴关系。该公司还看到其技术在信任与安全、政府、版权、金融、法律等领域的应用。

“我们相信我们可以让最聪明的人们一起致力于AI检测，” Tian说道。“检测领域是如此新颖，我们相信它值得更多的关注和支持。”

工具的缺失

Open AI，ChatGPT背后的公司，推出了一款AI 文本分类器用于检测机器生成的内容，但它远非百分之百可靠。该工具仅正确识别26%的AI写作文本为“可能是AI写作”，同时将人类写作的文本错误地标记为AI写作的概率为9%。该分类器在非英语语言上的表现“明显较差”，在代码和较短文本上“不可靠”。根据OpenAI的说法，对于与该工具的训练集中的文本非常不同的输入，分类器也可能出错。

“我们的分类器有一些重要的局限性，”该公司在网站上承认。“它不应被用作主要决策工具，而应作为确定文本来源的其他方法的补充。”

检测工具的不可靠性给教育工作者带来了困境。即使老师发现学生的一篇可疑文章被标记为70%可能是AI生成的，只要这些检测工具的准确性不是100%，老师很难采取果断行动。

“我认为我们不知道如何处理一个标记可能存在问题的标志，”哈佛图书馆创新实验室主任杰克·库什曼说，该实验室探讨诸如互联网影响之类的主题。“在那时，你所能做的就是与学生交谈，并告诉他根据这个工具的说法，你可能犯了学术不端行为。”

与此同时，随着AI的出现，抄袭的定义也在不断演变。“这将挑战整个学术诚信的概念，因为有时候使用一个推荐一两句话或帮助引用的工具会合法，就像使用计算器做数学工作一样，”他说。“最好的答案是你不应该让它写整篇文章。”

深度伪造的崛起

尼克·路易，PeakMetrics的联合创始人兼首席执行官，这家初创公司帮助政府和大公司打击虚假信息，他说他的客户对AI生成的文本威胁并不太担心，因为与深度伪造视频的泛滥相比，潜在危害要小得多，例如，在那里有更多恶意篡改内容的实例。

迄今为止，任何检测技术的技术限制以及缺乏明确的货币化途径使得吸引投资变得困难。Tola Capital的董事总经理Sheila Gulati表示，当前的检测工具是过渡性产品，阻碍新兴技术的发展通常不是人们利用它的好方法。她说：“我认为最终的状态将会更加复杂。”

一些行业观察者表示，开源技术使软件的源代码公开可见，允许用户自由查看、修改和分发，对于大型语言模型产品是有益的，因为它降低成本、增加透明度并促进创新。

然而，开源技术也更容易被黑客攻击，可能使检测工具更容易受到利用。“这有点像向一个窃贼展示你家监控网络设置的蓝图，”GPTZero的首席技术官兼联合创始人Alex Cui说。