Meta发布了最大的Llama 3 AI模型,宣传其语言和数学能力的提升 | 路透社
Katie Paul
Meta AI 标志在2023年9月28日拍摄的插图中可见。路透社/Dado Ruvic/插图/档案照片纽约,7月23日(路透社) - Meta Platforms (META.O)于周二发布了其大部分免费 Llama 3 人工智能模型的最大版本, boasting 多语言技能和一般性能指标,紧追 OpenAI 等竞争对手的付费模型。Facebook 母公司表示,新 Llama 3 模型可以用八种语言进行对话,编写更高质量的计算机代码,并解决比以前版本更复杂的数学问题,这些信息在博客文章和发布公告的研究论文中提到。
该模型拥有4050亿个参数,即算法在生成用户查询响应时考虑的变量,远超去年发布的 前一个版本,但仍小于竞争对手提供的领先模型。相比之下,OpenAI 的 GPT-4 模型据报道拥有一万亿个参数,而亚马逊正在 准备一个模型,其参数达到2万亿。首席执行官马克·扎克伯格在多个渠道推广 Llama 3 时表示,他预计未来的 Llama 模型将在明年超越专有竞争对手。他表示,由这些模型驱动的 Meta AI 聊天机器人有望在今年年底成为最受欢迎的 AI 助手,目前已有数亿人使用它。
此次发布是在科技公司竞相展示其日益增长的资源密集型大型语言模型能够在 已知问题领域如高级推理中带来足够显著的收益,以证明对它们的巨额投资是合理的。Meta的首席AI科学家表示,他相信这些模型将在推理方面遇到限制,其他类型的AI系统将需要产生突破。
除了其旗舰的4050亿参数模型外,Meta还发布了其轻量级的80亿和700亿参数Llama 3模型的更新版本,最初 在春季推出,该公司表示。这三种新模型都是多语言的,并且可以通过扩展的“上下文窗口”处理更大的用户请求,Meta的生成AI负责人Ahmad Al-Dahle表示,这将特别改善生成计算机代码的体验。
“这是我们从社区获得的第一反馈,”Al-Dahle在接受路透社采访时表示,并指出更大的上下文窗口给模型提供了类似于更长记忆的东西,有助于处理多步骤请求。
此外,Al-Dahle表示,他的团队能够通过使用AI生成一些用于训练的数据来提高Llama 3模型在解决数学问题等任务上的表现。
Meta将其Llama模型大部分免费提供给开发者使用,扎克伯格表示,这一策略将以创新产品、减少对潜在竞争对手的依赖以及在公司核心社交网络上增加参与度的形式获得回报。一些投资者已经 扬起了眉毛 对所涉及的成本,然而。如果开发者选择使用其免费的模型而不是付费模型,公司也将受益,这将削弱其竞争对手的商业模式。随着这一公告,Meta 宣传了在关键数学和知识测试中的进展,这可能使这一前景更具吸引力。
尽管衡量人工智能发展的进展 notoriously 困难,但 Meta 提供的测试结果似乎表明,其最大的 Llama 3 模型几乎与 Anthropic 的 Claude 3.5 Sonnet 和 OpenAI 的 GPT-4o 相匹敌,在某些情况下甚至超越了它们,这两者被广泛认为是市场上最强大的前沿模型。
例如,在 MATH 基准的竞争级数学文字问题中,Meta 的模型得分为 73.8,而 GPT-4o 的得分为 76.6,Claude 3.5 Sonnet 的得分为 71.1。
该模型在 MMLU 上得分 88.6,MMLU 是一个涵盖数学、科学和人文学科多个学科的基准,而 GPT-4o 得分 88.7,Claude 3.5 Sonnet 得分 88.3。
在他们的论文中,Meta 的研究人员还预告了即将在今年晚些时候推出的“多模态”版本模型,这些模型将在核心 Llama 3 文本模型的基础上叠加图像、视频和语音能力。
他们表示,早期实验表明,这些模型可以与其他多模态模型如谷歌的 Gemini 1.5 和 Anthropic 的 Claude 3.5 Sonnet “具有竞争力”。
通过《竞选之路》时事通讯获取每周关于美国选举的新闻和分析,以及其对世界的影响。注册 这里。