中国试图掌控互联网算法可能是在追逐一个不可能实现的梦想——《华尔街日报》
Karen Hao
中国强大的网络监管机构迈出了政府管控塑造互联网的自动化系统的开创性且充满不确定性的第一步。
本月早些时候,国家互联网信息办公室公布了国内二十多家最具影响力的互联网企业的30项核心算法概要,包括TikTok所有者字节跳动有限公司、电子商务巨头阿里巴巴集团控股有限公司以及中国无处不在的微信超级应用所有者腾讯控股有限公司。
这一里程碑事件标志着监管机构首次系统性要求互联网企业披露支撑其平台的技术信息,这些技术已展现出从流行文化到政治等全方位变革的能力。这也使北京走上了一条技术专家认为几乎没有政府(如果有的话)能驾驭的道路。
国家互联网信息办公室近期公布了部分中国最具影响力互联网企业的核心算法概要。图片来源:THOMAS PETER/REUTERS公开版本的申报文件用通俗语言解释了特定算法使用的数据类型及其数据处理方式。在许多情况下,这些披露的细节比Facebook自愿向用户提供的新闻推送内容排序机制更为简略。
知情人士表示,未公开的完整申报文件包含对数据和算法更详尽的描述,其中部分被视为商业机密信息。根据监管部门要求企业提供的公开文件说明,申报材料还包含对潜在安全风险的自我评估。
企业提交信息是为了响应今年三月生效的新规,该法规赋予监管部门整治算法负面影响的职责,包括有害信息扩散、侵犯用户隐私和零工劳动者权益等问题。新规还要求算法必须用于弘扬"正能量"——这个习近平时代的术语特指有利于舆论引导和展现共产党正面形象的内容。
在约束互联网基础算法权力方面,北京并非孤例。美国和欧盟监管机构同样在应对类似挑战,例如如何保护青少年心理健康及消除病毒式传播的虚假信息。
TikTok母公司是提交数据算法信息的互联网企业之一。图片来源:VCG/Getty Images然而中国这项法规标志着对算法实施直接监管的最强硬尝试。最终,该国所有使用算法技术的服务都将受其约束。
“他们正在尝试无人涉足之事,全球皆可从其成败中汲取经验,”斯坦福大学“数字中国项目”负责人格雷厄姆·韦伯斯特表示。该项目专门追踪中国数字政策发展动态。
北京某菜市场,顾客正通过微信——这款中国全能型应用——扫描二维码付款。图片来源:格雷格·贝克/法新社/盖蒂图片社算法专家指出,这项举措引发的核心问题在于:政府对算法实施直接监管是否具有现实可行性。
当前主流互联网平台算法均基于机器学习技术,该技术通过海量数据预测用户行为,从而实现广告定向投放等决策自动化。与传统由明确编码规则构成的算法不同,多数机器学习系统如同黑箱,其运行逻辑与使用后果难以解析预判。
据知情人士透露,北京对算法监管的关注始于2020年TikTok为避免在美遭禁而寻求美国买家之际。当中国监管部门宣布对信息推荐技术实施新出口管制后,多家竞购方退出短视频平台收购,这使中国政府意识到算法技术的重要性。
知情人士透露,中国国家互联网信息办公室迅速起草了一项关于算法推荐系统的新规,尤其旨在了解国内科技公司如何塑造网络舆论以及如何遏制这种影响。
韦伯斯特表示,到2022年1月,该规定已准备就绪,并于两个月后生效——对于一个有时会将立法草案搁置数年的政府来说,这一速度令人印象深刻。
网络安全监管部门未回应置评请求。
布朗大学计算机科学教授、本月刚卸任白宫科技政策办公室助理主任的苏雷什·文卡塔苏布拉马尼安表示,中国这一法规的覆盖范围和激进程度令美国科技政策界人士震惊。
文卡塔苏布拉马尼安称,去年秋天当Facebook举报人弗朗西斯·豪根在国会主张对这家公司的算法进行限制时,美国政府内部有些人对此产生了兴趣。但监管机构担心,这将为国家控制信息流动开创先例。
他表示:“一旦走上这条路,就很难回头。”
面对同样问题的欧盟监管机构采取了更强势的立场,但仍避免由政府直接审查算法。
今年7月,欧洲议会通过立法,要求谷歌和Facebook等大型平台定期评估其系统性风险,比如是否在传播非法内容。这些公司可以自行选择如何应对这些风险,包括调整算法,但必须接受独立审计以证明其解决方案确实有效。
新规要求算法传播"正能量",这一表述特指能够提振舆论氛围、对中国共产党持积极态度的内容。图片来源:谢尔顿·库珀/ZUMA Press政策专家表示,欧盟法律的实施细则和执行细节仍不明确。柏林非营利研究与倡导组织AlgorithmWatch执行董事马蒂亚斯·施皮尔坎普指出:“可能需要经过多年博弈甚至诉讼才能厘清法律内涵。”
中国监管措施同样存在模糊地带。理论上,新规可能让政府完全掌控主导网络空间乃至日益渗透线下生活的关键算法机制。但科技专家认为,北京当局的雄心很可能反成绊脚石。
社交媒体推荐引擎堪称最复杂的算法系统之一,Facebook和TikTok等应用使用数百甚至数千种算法来决定用户的信息获取。
曾为美国政府机构审查企业算法的审计师凯西·奥尼尔表示,即便掌握这些系统的详细文档甚至源代码,也不足以理解其对网络舆论等宏观层面的影响。“真正关键的是算法处理的数据流。“她强调。
奥尼尔指出,即便拥有随用户动态实时变化的全量数据,科技公司的工程师仍难精准调控系统行为。虽然定向调整(如增加宣传内容比重)可行,但根本不可能完全控制推荐引擎的整体运作。
科技分析师和业内专家也质疑,最初作为宣传部门成立的网信办是否具备执行其规则的技术专长。
知情人士透露,在中国新规生效后不久,字节跳动的政府关系经理和算法工程师就与网信办官员会面,解释他们提交的文件。其中一位人士表示,在一次会议中,该机构官员对技术细节理解有限,公司代表不得不借助比喻和简化语言来解释推荐算法的工作原理。
知情人士称,企业并未被要求提交代码或用户数据。
中国政府去年发布的指导意见要求多个机构扩充人员以监管算法。
“他们正在努力构建工具、招聘人员并获取技术专长来处理这类问题,“北京战略咨询公司Trivium China的科技政策研究主管Kendra Schaefer表示。“因此,未来五到十年内,执法力度将逐步加强。”
Raffaele Huang对本文亦有贡献。
联系作者 Karen Hao,邮箱:[email protected]
更正与补充
中国针对互联网公司算法出台了新规。本文早期版本错误地称其为新法律。(已于8月31日更正)
出现在2022年8月31日的印刷版中,标题为《中国公布互联网算法》。