来自中国的人工智能视频正在向世界进发 - 彭博社

Catherine Thorbecke

2025-01-24

缩小与硅谷的差距。

摄影师：彭博社

中国人工智能公司正全力以赴缩小与美国的发展差距。尽管华盛顿的努力阻碍行业发展，但它证明了自己能够与硅谷保持竞争力。

我花了一些时间玩弄 Vidu 2.0，这是一款经过改进的 AI 视频生成器，被称为 OpenAI 的 Sora 的国内竞争对手。上周由与中国 AI 创新中坚力量清华大学有联系的北京初创公司盛书科技发布，该公共平台允许来自世界各地的任何人将图像转换为短视频。

彭博社观点日本和韩国曾是稳定的美国盟友。现在不再是通用电气需要在股息和回购之间取得更大平衡加密货币永动机英国百万富翁外流更多是涓涓细流而非洪水我制作的一些片段仍然存在显著的不一致性：扭曲的面部表情、似乎违背物理法则的肢体动作，以及其他明显表明这些是人工智能生成的迹象。（这些局限性似乎也困扰着行业领袖Sora。）

但我对它的速度印象最深刻。在几秒钟内，我能够制作出假片段，展示唐纳德·特朗普哭泣或浪漫拥抱埃隆·马斯克。该公司表示，真正的突破在于其降低与此技术相关的成本，声称其短视频内容的制作成本比行业平均水平低55%。

Vidu 2.0的发布恰逢中国另一个意外的人工智能发展：上个月底推出的 DeepSeek-V3。这个大型语言模型不仅在全球基准测试中表现出色，而且据报道是在极低的成本下开发和训练的。OpenAI的创始成员之一，安德烈·卡尔帕西，称其为“预算的笑话。”英伟达公司高级研究经理Jim Fan补充说DeepSeek证明了：“资源限制是一件美好的事情。”

接连的进展及时提醒新任美国政府，现在是审视其出口管制和其他政策在阻碍中国人工智能行业方面的有效性的时候了。这也暴露了北京的价值观是如何深深融入这一新兴技术的。

Vidu 2.0 提供了英语界面，因为盛书科技似乎在国内宏观经济不确定的情况下，瞄准国际和美国市场。但这个工具很快就暴露了它的根源。当我试图制作一段中国国家主席习近平的视频剪辑时，我的输入照片和请求立即被拒绝。该平台必须遵循规定，科技公司阻止政治人物的形象被操控并不是一件坏事。尽管我能轻易让特朗普泪流满面，但却无法生成习近平的内容，这似乎有些奇怪。

DeepSeek 中也有政治观点的证据。当我询问聊天机器人关于中国共产党在新疆的人权记录时，它给出的回答庆祝了中共“全面推进人权事业”和“各民族和谐共处”的情况。这与国际组织的观点相去甚远。

随着全球越来越多的人转向中国人工智能工具，从作业帮助到创建社交媒体内容，这些偏见的表现可能会产生意想不到的后果。

围绕AI生成视频的国际关注也如山般沉重，特别是像Vidu这样的工具，无法被忽视。多媒体片段可能通过令人信服地模仿他人的喜好，包括公众人物，制造混乱和困惑。在全球范围内，人们对深度伪造技术被用来针对、欺骗和骚扰个人，甚至生成非自愿色情内容的担忧日益加剧。还有报道称，北京曾利用AI视频技术在过去大规模传播亲中国和反美国的宣传。

随着中国和美国越来越多的公司向公众发布这些工具，政策制定者必须跟上安全保护的步伐。Vidu上有无数的保护措施来防止滥用，并且似乎在不断改进。（当我尝试Vidu的第一个版本时去年夏天，它在提示下移除了我的上衣，暴露了我的肩膀。而Vidu 2.0在我测试时拒绝移除任何人的衣物。）

AI生成视频也悄然成为中央政府的技术优先事项。国家支持的《环球时报》多次表示其认可，宣称 AI生成内容在国内电影和电视制作中“即将蓬勃发展”。Vidu被用来制作一段令人印象深刻的宣传视频，该视频在去年十月在中国的索尼影业 《毒液：致命守护者》 放映前播放——这是党喉舌另一个宣传的举措。

制作更长的剪辑或超现实的深度伪造仍然是Vidu用户一个繁琐且耗时的过程。视频目前最长仅为八秒。但它们提供了未来的一个暗示，得到了北京的支持——只要它们遵循其政治。Vidu并不是唯一的参与者：它处于一个日益拥挤的领域，从Zhipu AI和MiniMax等初创公司到字节跳动有限公司和阿里巴巴集团控股有限公司等巨头也在提供视频生成产品。

使这些产品更便宜的突破为它们在全球市场中提供了竞争优势。这应该引起远超硅谷的关注。

更多来自彭博社观点：

埃隆·马斯克对人工智能风险的沉默是震耳欲聋的：帕米·奥尔森
这就是如何预测中国万科的未来：任舒丽
抖音作为一个应用程序生存太受欢迎而无法禁用：戴夫·李

想要更多彭博社观点？OPIN <GO>。或者您可以订阅我们的每日通讯。