英伟达最新投资的是一家专注于视频搜索的人工智能初创公司 - 彭博报道

Saritha Rai

2024-06-04

Jae Lee来源：Jenna Kang，EK Yoon/Jenna Kang，EK Yoon英伟达公司正在与Twelve Labs Inc. 共同领投一笔价值5000万美元的投资，这是该公司对两位韩国出生的工程师的最新押注，他们希望帮助用户快速搜索和分析大量视频。

美国风险投资公司New Enterprise Associates以及包括Radical Ventures、Index Ventures SA和Korea Investment Partners在内的现有投资者参与了这轮融资，这家初创公司在一份声明中表示。这笔交易维持了英伟达对初创公司的投资狂热步伐，自2023年以来，该公司已向Hugging Face、Cohere和Mistral AI等新兴人工智能公司注入了资金。

Twelve Labs 在英伟达这位大名鼎鼎的支持者的帮助下获得了成功，英伟达的芯片对生成式人工智能的训练和开发至关重要。这家美国芯片制造商正在构建一个跨越从硬件到模型和应用程序的关键人工智能领域的投资组合。它最新的选择是一家总部位于旧金山的初创公司，该公司提供基础模型来执行各种任务，比如构建聊天机器人或翻译语言。总体目标是使视频可搜索且易理解。

Twelve Labs成立于2021年，创始人Jae Lee和Aidan Lee在韩国的基本军事训练期间相识。其客户包括社交媒体影响者、美国和欧洲的体育联赛以及好莱坞电影工作室——其中一些拥有长达75年的档案。该初创公司旨在通过在海量在线内容中检索精确时刻来使搜索更加容易，比如当特定足球运动员用翻转庆祝触地得分时，或者 Gordon Ramsay 因煮熟的鸡蛋而生气的时刻。

“视频一直是人工智能领域的一个问题。它信息密集且难以利用，”首席执行官李杰告诉彭博新闻。“全球近80%的数据是视频。对我们来说，视频是第一语言，我们从头开始构建了我们的技术。”

阅读更多：英伟达参与为AI聊天机器人制造商Kore.ai筹集1.5亿美元资金

Twelve Labs旨在与英伟达合作，让其Marengo和Pegasus平台面向更多用户。与主要处理文本的其他模型不同，他们最初是通过视频进行训练，这有助于使基于视觉的搜索更直观，李说。该AI模型可以处理视频、文本、图像和音频，允许跨多种数据输入进行搜索，如文本到视频、文本到音频和图像到视频。

“我们在多模态流行之前就开始了，”首席执行官说。“我们在基础模型变得炙手可热之前就开始了我们的工作。”

Twelve Labs表示，其模型被超过30,000名开发人员使用，涵盖媒体和娱乐、广告、汽车和安全等行业。他们将其模型用于语义视频搜索和生成摘要。该初创公司预计其员工人数将在2024年增加一倍，达到约80人。

该初创公司的最新模型Pegasus，可以从视频中生成文本，目前正在进行测试阶段。它旨在理解和搜索复杂的视频内容，帮助总结、查询和找到答案，并进行分析。Twelve Labs同时训练基础模型的多个组件，将其尺寸减小到最初的五分之一左右。这反过来提高了计算和能源效率。

进步使视频像文本一样易于处理，“不会让银行破产，”CEO李说。

阅读更多：英伟达支持英国自动驾驶初创公司Wayve进行10亿美元融资

亚马逊公司从初创公司Adept AI Labs Inc.聘请了高管和其他员工，这是这家电子商务和云计算巨头为加强人工通用智能（AGI）的发展而采取的举措，AGI是AI的高级版本，可以像人类一样思考。

据亚马逊向彭博社提供的内部备忘录显示，Adept的联合创始人兼前首席执行官David Luan将加入亚马逊的AGI自主团队，该团队由Rohit Prasad领导。另外四位联合创始人和其他若干团队成员也将加入Prasad的团队。