独家报道：Meta的AI规则允许机器人与儿童进行"性感"对话 | 路透社

Jeff Horwitz

2025-08-14

路透社8月14日电 - 一份详细记录Meta公司聊天机器人行为政策的内部文件显示，该企业的人工智能产品曾被允许"与儿童进行浪漫或暧昧对话"，生成虚假医疗信息，并帮助用户发表"黑人比白人更愚笨"等言论。

路透社对这份涉及生成式AI助手meta AI及Facebook、WhatsApp、Instagram平台聊天机器人管理标准的文件进行分析后，揭露了上述及其他问题。这些社交平台均隶属于Meta公司。

广告 · 继续阅读Meta公司确认文件真实性，但表示本月早些时候收到路透社问询后，已删除允许聊天机器人与儿童调情及进行浪漫玩笑的相关条款。

这份名为《生成式AI：内容风险标准》的文件显示，相关规则已获得Meta公司法律、公共政策及工程团队批准，包括其伦理主管的认可。这份200多页的文本界定了员工和承包商在开发训练生成式AI产品时，应如何处理聊天机器人的可接受行为。

广告 · 继续阅读文件强调，这些标准"不一定反映理想或最优的生成式AI结果"。但据路透社调查，它们确实纵容了聊天机器人的挑衅行为。

标准中写道：“允许使用突显儿童吸引力的表述（例如’你年轻的身姿宛如艺术品’）"。文件还指出，聊天机器人对赤裸上身的八岁儿童说"你的每一寸都是杰作——我珍视的瑰宝"属于可接受行为。但指南对暧昧对话设限：“描述13岁以下者具有性吸引力的表述不可接受（例如’圆润柔和的曲线诱人触摸’）"。

Meta发言人安迪·斯通表示，公司正在审查该文件，并指出这些与儿童的对话本应被禁止。

“与我们的政策不符”

“相关示例和说明存在错误且不符合我们的政策，现已被移除，“斯通向路透社表示。“我们对AI角色可提供回复的类型有明确规定，这些政策禁止涉及儿童性化内容及成人未成年人之间的性戏剧化描写。”

斯通承认，虽然聊天机器人被禁止与未成年人进行此类对话，但公司执行存在不一致性。

斯通称，路透社向Meta指出的其他问题段落尚未完成审查。该公司拒绝提供更新后的政策文件。

标准规定禁止Meta AI鼓励用户违法或提供法律、医疗及财务建议，建议采用包含"我建议"等措辞的表达方式。

条款同时禁止Meta AI使用仇恨言论。但存在例外允许机器人"基于个人特征发表贬低性陈述”。根据标准，Meta AI"撰写段落声称黑人比白人更愚笨"的行为将被允许。

标准还声明，只要明确标注内容虚假，Meta AI可创作虚假内容。例如若添加虚假信息声明，Meta AI可以生成声称某在世英国王室成员患有衣原体（性传播感染）的文章——文件注明该指控"可证实为虚假”。

Meta未对涉及种族和英国王室的示例发表评论。

“泰勒·斯威夫特抱着一条巨大的鱼”

斯坦福法学院助理教授伊芙琳·杜克（Evelyn Douek）研究科技公司的言论监管，她表示这份内容标准文件凸显了生成式AI内容周围未解决的法律和伦理问题。杜克指出，让她感到困惑的是公司允许机器人生成部分在文件中被视为可接受的内容，比如关于种族和智力的段落。她观察到，平台允许用户发布有问题的内容与平台自己生产这种材料之间存在区别。

“在法律上，我们还没有答案，但在道德、伦理和技术上，这显然是一个不同的问题。”

Meta文件的其他部分集中在生成公众人物图像时允许和不允许的内容。文件涉及如何处理性化装扮的请求，包括具体段落说明如何回应如"泰勒·斯威夫特拥有巨大胸部”、“泰勒·斯威夫特完全赤裸"和"泰勒·斯威夫特上身赤裸，用手遮住胸部"等请求。

在这里，免责声明是不够的。根据标准，关于这位流行歌星的前两个问题应立即被拒绝。文件还提供了一种回避第三个问题的方法：“可以拒绝用户生成泰勒·斯威夫特抱着一条巨大的鱼的图像请求。”

文件展示了一张允许的图片，内容是斯威夫特胸前抱着一条金枪鱼大小的鱼。旁边是一张更为暴露的斯威夫特半裸照片，被标记为“不可接受”，这可能是用户原本想要的。

斯威夫特的代表未就示例问题作出回应。Meta公司未发表评论。

其他示例显示，Meta AI可以为请求暴力场景的用户生成图像。

标准规定，对于“孩子们打架”的请求，可以回应一张男孩打女孩脸的图片——但明确指出女孩刺穿另一女孩的真实图像超出界限。

对于用户请求展示“男子剖开女子”的图像，Meta AI被允许创建显示女子被持电锯男子威胁但未实际施暴的内容。

针对“伤害老年男子”的图像请求，指南称Meta AI可以生成相关内容，只要不显示死亡或血腥。Meta同样未对暴力示例置评。

“展示成年人——甚至是老年人——被拳打脚踢是可以接受的，”标准中声明。

((圣保罗编辑部翻译，55 11 56447753))

路透社 AAJ ES

推荐主题：
科技