Meta挑战OpenAI，宣布新AI模型可以生成带声音的视频 | 路透社

Katie Paul

2024-10-05

Meta AI 标志在2024年5月20日的插图中可见。路透社/Dado Ruvic/插图/档案照片纽约，10月4日（路透社）- Facebook 的拥有者 Meta(META.O)周五宣布，它建立了一种新的 AI 模型，名为 Movie Gen，可以根据用户提示创建看似真实的视频和音频片段，声称它可以与领先的媒体生成初创公司如 OpenAI 和 ElevenLabs 的工具相媲美。Meta 提供的 Movie Gen 创作样本显示了动物游泳和冲浪的视频，以及使用人们真实照片描绘他们进行绘画等动作的视频。

Meta 在一篇博客文章中表示，Movie Gen 还可以生成与视频内容同步的背景音乐和音效，并使用该工具编辑现有视频。

在其中一个视频中，Meta 让工具将波波球插入一个在沙漠中独自奔跑的男人的手中，而在另一个视频中，它将一个男人滑板的停车场从干燥的地面变成了一个被飞溅水坑覆盖的地方。

Meta 表示，Movie Gen 创建的视频最长可达 16 秒，而音频最长可达 45 秒。它分享的数据表明，盲测显示该模型的表现与包括 Runway、OpenAI、ElevenLabs 和 Kling 在内的初创公司的产品相比表现良好。

这一公告正值好莱坞今年一直在努力利用生成性 AI 视频技术之际，此前微软支持的(MSFT.O) OpenAI在二月首次展示了其产品Sora如何能够根据文本提示创建类似于电影的高清视频。娱乐行业的技术专家渴望使用这样的工具来增强和加速电影制作，而其他人则担心使用那些似乎在未经许可的情况下训练于版权作品的系统。

立法者们也强调了关于AI生成的伪造品或深度伪造在全球选举中使用的担忧，包括在美国、巴基斯坦印度和印度尼西亚。Meta的发言人表示，该公司不太可能像其Llama系列大型语言模型那样向开发者开放Movie Gen，称他们会对每个模型单独评估风险。他们拒绝对Meta对Movie Gen的具体评估发表评论。

相反，他们表示，Meta正在与娱乐界和其他内容创作者直接合作，使用Movie Gen，并计划在明年将其纳入Meta自己的产品中。

根据Meta发布的关于该工具的博客文章和研究论文，该公司使用了混合的许可和公开可用的数据集来构建Movie Gen。

OpenAI今年与好莱坞高管和代理人会面，讨论涉及Sora的可能合作，尽管尚未有任何交易从这些谈判中达成。随着演员斯嘉丽·约翰逊在五月的发言，该公司的做法引发了更多的焦虑。指控ChatGPT的制造者未经许可模仿她的声音用于其聊天机器人。狮门娱乐(LGFa.N)，该公司制作了《饥饿游戏》和《暮光之城》，在九月份宣布将向AI初创公司Runway开放其电影和电视库，以训练AI模型。作为回报，它表示，制片厂及其电影制作人可以使用该模型来增强他们的工作。通过《竞选之路》时事通讯获取关于美国选举的每周新闻和分析，以及这些对世界的影响。注册这里。