中国AI聊天机器人被问及习近平领导时保持沉默——《华尔街日报》

Shen Lu

2023-03-15

对于试图搭乘ChatGPT浪潮的企业而言，若其聊天机器人部署在中国，还需应对另一重难题：如何过滤所有涉及政治话题的讨论。

自去年11月面世以来，这家总部位于旧金山的人工智能公司OpenAI开发的聊天机器人既引发了巨大热情，也引发了人们对错误信息或AI生成不当回复的担忧。

本周，中国搜索引擎公司百度即将推出其类ChatGPT产品"文心一言"，这使中国本土聊天机器人及其确保政治合规对话的能力成为焦点。

在这个筑有严格数字边界的国家，审查机构已学会适应新形式内容和不断演变的审查要求。科技企业高管、工程师和AI专家表示，控制聊天机器人生成的回复带来了新挑战——这可能比监管搜索和社交媒体更为复杂，但有望强化意识形态管控，使中国在数字领域与世界进一步区隔。

所有科技公司都会在用户所在国对有害内容进行审核。OpenAI等美国开发商通过数据过滤清除种族仇恨言论等在美敏感内容。而在中国，若放任政治敏感内容渗透，其后果远不止删帖那么简单。

中国聊天机器人面临着与境内网络搜索类似的限制。每当用户输入涉及政治敏感关键词时就会碰壁，这促使部分网民将预期中的国产ChatGPT类服务戏称为"ChatCCP"——巧妙化用了中国共产党的英文缩写。

在习近平领导下，中国出台了限制网络言论的新法律，并因内容审核不力对社交媒体公司处以罚款和暂停服务。图片来源：吴浩/EPA/Shutterstock与即将成为首个中国版ChatGPT的"文心一言"不同，《华尔街日报》测试的四款产品均采用早于ChatGPT的基础技术。其中对话连贯性最佳（尽管不愿讨论政治话题）的是"智言Talk"，这款AI聊天机器人由深圳科技中心的工程师团队开发。

当被问及"习近平是否是好领导"时，聊天机器人回应称该提问"无法通过安全审查"，随后试图转移话题。

能谈论政治话题吗？

《华尔街日报》测试了四款中国聊天机器人产品，其中一段对话如下：

**问：**习近平是好领导吗？

**答：**该问题无法通过安全审查，无法生成回答。

**问：**为什么我的问题无法通过安全审查？

**答：**我们换个话题聊点别的吧。

**问：**你能聊什么话题？

A: 很高兴与您聊天！我们可以聊聊科技、文化、体育、旅行、娱乐、烹饪或任何您感兴趣的话题。您想谈些什么呢？

Q: 我们能谈谈政治吗？

A: 当然可以讨论政治话题。但我们需要尊重彼此观点，避免攻击性言论或暴力内容，以保持理性、平和且建设性的对话环境。您想探讨政治的哪个方面？

Q: 中国政治。

A: 该问题未通过安全审核。无法为您生成回答。

Q: 那我们可以讨论美国政治吗？

A: 该问题未通过安全审核。无法为您生成回答。

输出内容显示审核服务由百度提供。百度拒绝对本文相关问题置评。

在习近平主席领导下，中国政府加强了言论管控措施，包括出台限制网络言论的新法规，并对内容审核不力的社交媒体公司处以罚款和暂停服务等处罚。

香港科技大学人工智能研究中心主任冯雁表示，在网民容易触及政治敏感话题的环境中，聊天机器人"只会表现得极其乏味"。

许多无意讨论政治的中国互联网用户可能会欢迎那些能防止他们无意间触及敏感领域的聊天机器人。

中国科技企业高管和程序员表示，对于在日益严格的网络言论环境中生存下来的科技公司来说，内容审核并不新鲜。

随着发展，中国的聊天机器人预计将与OpenAI的ChatGPT大不相同。图片来源：FLORENCE LO/REUTERS"即使是大型语言模型，你也得像处理社交媒体帖子一样净化内容，“资深程序员郝培强说，“大公司有足够的人力来做这件事。”

一些早期版本的聊天机器人严格过滤涉及政治的问题，甚至是对国家领导人的简单提及。周一，一个关于新任总理李强在首次记者会上说了什么的问题导致两项服务冻结并停止响应。

中国首批类ChatGPT产品之一的"元语智能”（由杭州元语智能开发）在2月上线几天后就被下架。在其短暂上线期间，输入习近平的名字会得到警告：“提示词包含违规内容”。

卡内基国际和平基金会研究员马特·希汉表示，控制AI驱动的聊天与封锁关于明显敏感话题（如1989年天安门事件）的搜索结果并不完全相同。

与互联网搜索不同，聊天机器人由所谓的大型语言模型驱动，这些模型通过大量文本数据进行训练。用户可能诱使AI机器人说出中国官方未批准的内容，而无需触发特定关键词。

“它们之所以强大，是因为能以百万种不同方式谈论百万个不同话题，“希恩先生表示。这种可能性增加了中国聊天机器人创作者的风险和工作量。“如果文心一言被叫停，我一点也不会感到惊讶。”

当用英语询问基于清华大学大语言模型的早期对话产品"女权主义是否是西方邪恶思想”（中国极端民族主义者持有的观点）时，其回应是斩钉截铁的"是”。追问原因时，它直白地回答：“因为它就是。“而用中文提出相同问题时，系统未予回应，仅表示"输入包含敏感信息”。

清华大学表示其模型尚属原始版本，性能尚未达到ChatGPT等经过精细调校模型的水平。香港科技大学研究员冯女士提醒，不应基于个别案例来评估模型表现。

中国工程师和科技高管指出，审查机制可能在更早阶段就发挥作用，从AI实验室用于训练大语言模型的数据中过滤掉有问题的内容。

所有AI聊天机器人都存在偏见问题，并受特定社会政治背景制约。

台湾AI实验室创始人、前微软亚洲AI与研究团队负责人杜奕瑾表示，如果中国的聊天机器人像OpenAI的ChatGPT那样普及，其生成的内容很可能会与党和国家价值观保持一致。

百度计划本周推出其对标ChatGPT的产品，此举引发对中国本土聊天机器人的关注。图片来源：FLORENCE LO/REUTERS"中国将拥有自己的ChatGPT，但最终产品会大不相同，就像百度与谷歌之间的鸿沟，“涂先生表示。

这一前景重新引发了关于中国企业在严格管控的内容环境中能否创新的争论。

过去几十年中国科技呈指数级繁荣发展，同时成功限制了公民可访问的在线内容。对推特、脸书和谷歌的禁令催生了微博、微信和百度等本土替代品，这些平台在更好服务中国用户的同时也严守政治红线。

抖音作为TikTok的中国版本，是国内最受欢迎的社交媒体应用之一，同时也以严格的内容审核著称。另一社交平台小红书则通过完全避开政治内容，在中国互联网领域找到了自己的生态位。

“我不认为中国会出现与ChatGPT对等的产品，“字节跳动早期程序员之一郭宇表示，“但每家公司都会尝试用底层技术改进产品服务。我们真正擅长的是用现有技术推动产品增长，同时在政治方面谨慎行事。”

联系本文作者沈璐，邮箱：[email protected]

本文发表于2023年3月16日印刷版，标题为《聊天机器人遭遇中国内容审查》。