Open AI的Sora视频工具试图跟上Runway - 彭博社
Rachel Metz
插图:Nick Little for Bloomberg Businessweek在线流传的一段视频展示了三只巨大长牙野兽在晶莹的白雪中蹦跳,仿佛是国家地理纪录片中的一幕——只是毛象在视频摄像机发明之前已经灭绝了数千年。
OpenAI 在二月发布了这段10秒的视频片段,介绍了Sora,它的新人工智能软件,可以将书面提示转化为看起来惊人逼真的长达一分钟左右的视频。这一新功能以及围绕它产生的瞬间热潮,让人回想起2022年底OpenAI推出ChatGPT时的情形,那一举动瞬间颠覆了科技领域,并将人工智能推向公众视野。
不过,这一次,OpenAI并不是在开创新局面,而是在努力赶上其他已经提供类似工具的初创公司。这次演示并没有伴随产品发布或明确指示何时可能会发布。公司告诉彭博新闻,尽管一位高管最近表示该服务将在今年晚些时候发布,但目前尚未设定Sora的时间表。
一年半前,Meta平台公司和谷歌展示了文本到视频的研究项目,展示了简单、几秒钟长、低分辨率的片段,其中包括一个融化的冰淇淋筒,一只飞行的超级英雄狗和其他主题。Runway AI公司,迄今为止已经筹集了2.37亿美元,去年三月发布了Gen-2,引发了围绕AI视频生成器的狂热。该服务可以根据提示生成略显断断续续的三秒钟视频片段,比如“沙漠景观的无人机镜头”。现在,联合创始人兼首席执行官Cristóbal Valenzuela表示,它可以制作大约20秒的质量显著提高的视频。
Runway创始人(从左至右)Alejandro Matamala-Ortiz、Cristóbal Valenzuela和Anastasis Germanidis在曼哈顿的办公室。摄影师:Justin J Wee/纽约时报/Redux其他AI初创公司,包括Haiper、Pika和Stability AI,也正在开发可以生成更复杂短视频片段的工具,包括移动图像和音效(想象一下培根在平底锅中煎炸时发出的声音)。这些初创公司推出了任何人都可以廉价或免费使用的视频生成软件。这些工具的进步速度甚至超过了一些一直在研究这项技术的人的预期,足以引起那些担心视频创作经济学或复杂虚假信息传播的人的担忧。
即使Sora演示并非产品发布,但Pika的联合创始人兼首席执行官Demi Guo表示,这展示了技术的潜力。Pika去年底推出了其人工智能视频制作软件,已筹集了5500万美元。“它展示了我们目前距离高质量视频有多接近,以及我们距离更积极地商业化有多接近,” Guo说,并补充说,围绕Sora的炒作已经帮助她的公司吸引更多潜在员工。
Valenzuela表示,Gen-2已经被数百万人使用,包括制作和动画工作室的专业人士,他们依靠它进行预观和故事板设计。他说,电影编辑正在使用Runway创建视频,并将其与其他镜头合并以制作B卷或视觉效果,他补充说,麦当娜在演唱会上使用它展示了一些视觉效果。Valenzuela表示,随着Sora的推出,尽管AI视频生成器仍处于萌芽阶段,但现在已经“跨越了鸿沟”,进入了主流意识。
Paul Trillo,一位导演,他的作品包括福特F-150商业广告、音乐视频和实验电影,表示他已经将AI图像和视频生成器整合到他的创作过程中一段时间了。作为Runway软件的早期用户,他发现它让他能够探索更多概念和特效。他说他不认为AI会取代电影制作者,因为它无法复制人类创作的微妙或自发性。不过,“AI提供了一些更加迷人的东西,某种程度上比仅仅拿起相机更有趣,”他说。“你在这个混沌的海洋中探索,发现底部的这些奇异的宝石。”
Giada Pistilli,AI初创公司Hugging Face的首席伦理学家,表示这项技术有可能使为电影添加特效变得更加容易和便宜,这可能特别有助于低预算的电影制作者。但在她看来,负面影响,比如使传播AI生成的虚假信息和色情内容变得更容易,超过了积极影响。“有人可能会说,‘Photoshop也是如此,任何已经存在的工具也是如此,’”她说。“我不同意。我会说,AI的第一个特点是它很容易扩展。”
Pistilli摄影师:Maelia Germain目前,这项技术存在明显的局限性。《彭博商业周刊》对Pika和Haiper的文本到视频软件,以及Runway的Gen-2和Stability AI的Stable Video进行的测试显示,这些系统经常无法生成遵循简单输入提示的视频。Sora尚未公开提供测试,但即使是一些OpenAI精心挑选的片段也显示,让物体忠实地遵循物理定律对视频生成软件仍然是一个棘手的问题。
使用AI生成视频比运行聊天机器人或静态图像生成器更加计算密集,因此更昂贵且速度较慢。这些技术挑战可能会影响视频生成的商业模式,导致价格转嫁给客户。Runway用户需要购买积分来使用其软件,Valenzuela表示,用户大约需要花费1美元来生成20秒的视频。价格可能会下降;通常随着硬件和软件的改进,技术会变得更加便宜。Valenzuela表示,专业动画和视觉效果工作室可能会收取8000至25000美元或更多的费用,用于制作一分钟的动画或创作电影。他预测,到年底会有人制作一部至少60分钟长的电影,其中每个场景都使用AI视频生成器。
Guo表示,Pika可能在一年内拥有可以创建大约一分钟长的高质量视频片段的软件,而在两年内,它可以用来制作一部长片。但在那之前甚至可能会产生巨大影响:许多人在电影、广告或社交媒体上观看的视频片段都不到10秒钟。阅读下一篇: 金牌程序员构建了一个可以替代他们工作的人工智能