《华尔街日报》:人工智能与新闻业彼此需要
Francesco Marconi
图片来源:Getty Images十年前在美联社的新闻编辑室里,我见证了一个新时代的诞生:AI执笔写新闻。在人工智能尚未如今天这般显赫之前,提出机器承担编辑工作这一大胆设想的并非科技界领袖,而是美联社的记者们。当我看着一行行代码编织出新闻报道时,一个念头挥之不去:新闻难道不该是采写而来,而非生成所得吗?
时间快进到今天,这场曾引发争议的变革已被证明对美联社及其他众多机构具有革命性意义。面对新闻报道中两大艰巨挑战——覆盖日益扩展的新闻广度与突破人类能力极限——人工智能重塑了整个行业。AI使美联社将季度财报覆盖公司从400家扩展到4000家,这产生了连锁反应:斯坦福大学研究发现,如此全面的报道刺激了新覆盖公司的交易活动,提升了流动性,增强了市场整体活力。
如今先进大语言模型的出现预示着更深刻的变革。它们不仅能辅助报道,更能协助深度挖掘大数据、量化事件发生频率、揭示曾被掩盖的洞见。通过偏见检测与人类判断力的结合,AI工具可以惊人速度将海量文件浓缩为精准叙述。这种人机协作——人类直觉与机器精确性的融合——正推动新闻业迈向更快速且更具分析性的未来。
新闻业的价值不在于其总结的内容,而在于其揭示的真相。它往往依赖于通过人际对话获得的第一手资料,有时需要进行数十次甚至数百次采访。而人工智能机器人则毫无节制地吸收每篇发布的新闻文章、每次进行的访谈以及每个精心打磨的故事。当这些算法梳理数字世界时,记者们和其他众多作者的辛勤成果便成了它们的主要教材。
这里隐含的契约很明确:人工智能要发展,新闻业必须繁荣。忽视新闻业的健康发展不仅会损害其自身未来,还可能为人工智能提供劣质数据,进而为可怕的"模型崩溃"埋下隐患。因此,在人工智能的演进过程中,人类新闻工作的成果堪称黄金。当科技巨头们从挖掘数据中获利时,这些信息的源头——新闻行业——却往往既得不到认可,也得不到回报。现在是时候偿还这笔债务了。
我们必须承认这种失衡。许多作为数据宝库的新闻机构正面临资金困境,而财力雄厚的人工智能公司却苦于缺乏高质量数据。如果经济学家大卫·李嘉图目睹这一现代难题,他很可能会联想到其比较优势理论,并提出市场驱动的解决方案:让两个行业发挥各自优势进行合作。
为用于AI训练的新闻数据定价是个复杂课题。《纽约时报》起诉AI公司侵犯版权的案件标志着重大转折。此案可能成为确立法律如何评估大语言模型训练所用新闻内容价值,以及裁定历史使用补偿标准的里程碑判例。
随着出版商与AI企业关系的演变,双方亟需明确的合作准则。虽然大型新闻机构在补偿谈判中可能占据优势,但小型从业者面临被边缘化的风险,这可能导致行业内部出现不平等现象。
当主流媒体要求AI开发者为内容使用付费时,寻找多方共赢的解决方案至关重要。借鉴Shutterstock贡献者基金的收益分成模式——该基金对AI训练中使用的内容创作者作品进行补偿——或能推动更公平的利益分配。实现这一目标需要充分理解数据的使用方式。
在算法数据透明度需求高涨和监管审查日益严格的背景下,出版商与AI的关系正在重塑。行业在推进这些议题时,必须确保创新活力不受束缚。1846年电报技术的出现曾促使纽约五家日报整合资源,最终催生了美联社。AI时代同样蕴含着协作机遇:通过建立联合机制,新闻机构可以设计允许初创企业和独立开发者获取优质训练数据的激励体系,构建互利生态。
关键在于承认新闻业对AI发展不可替代的贡献。尽管这种贡献依然重大,但新闻原则的核心正经受挑战。当科技巨头开始扮演资深编辑的传统角色时,新闻业丰富的专业积淀可能面临被稀释的风险。
我们已经看到搜索引擎提供由AI生成的新闻摘要,汇集来自不同网络来源的新闻片段。这类自动化摘要存在掩盖全球对话背后无数新闻视角的风险。它们非但未能通过呈现多元观点拓宽读者视野,反而可能在无意中限制理解。随着科技公司同时扮演AI上游开发者和下游分发者的角色,其责任也随之加重。他们必须认识到这一点,并与新闻机构合作,努力确保内容的真实性和事实的平衡呈现。
人类创作与机器生成内容的界限已然模糊,责任不仅在于信息生产者。新闻消费者也需要善于辨别所接触的内容:事实、观点还是算法产物。如果AI在塑造或传播叙事中发挥作用,其参与应当明确标识。区分不同信息来源成为维护新闻业诚信与可信度的基石。
AI工具即将成为全球新闻编辑室的标配。这条路或许充满挑战,但讲故事的核心理念必须坚守。新闻业不仅是训练算法的数据点,更是引导AI透明度和伦理的道德罗盘。现在是时候正视并回馈新闻业对AI领域的贡献了。
马可尼先生是AppliedXL公司的首席执行官,这家总部位于纽约的公司专注于AI与计算新闻学。他曾担任《华尔街日报》研发主管和美联社AI联合负责人。
出现在2023年12月29日的印刷版中,标题为《人工智能与新闻业彼此需要》。