Meta本月即将发布新的AI模型Llama 4,信息报道 | 路透社
Reuters
Meta的标志在瑞士达沃斯公司临时展位的入口处可见,2025年1月18日。路透社/Yves Herman/档案照片4月4日(路透社)- Meta Platforms(META.O)计划在本月晚些时候发布其大型语言模型的最新版本,此前已至少推迟了两次,信息网站周五报道,作为Facebook的拥有者,Meta正在努力在人工智能竞赛中领先。然而,Meta可能会再次推迟Llama 4的发布,该报告称,引用了两位熟悉此事的人士。
路透社日报简报提供您开始一天所需的所有新闻。注册这里。
大型科技公司在OpenAI的ChatGPT成功后,积极投资于人工智能基础设施,这改变了科技格局并推动了机器学习的投资。
报告称,推迟的原因之一是在开发过程中,Llama 4未能满足Meta在技术基准方面的期望,特别是在推理和数学任务上。
该公司还担心Llama 4在进行类人语音对话方面的能力不如OpenAI的模型,报告补充道。
Meta计划在今年花费多达650亿美元来扩展其人工智能基础设施,因投资者对大型科技公司施加压力,要求其展示投资回报。此外,中国科技公司 DeepSeek 的流行低成本模型的崛起挑战了开发最佳AI模型需要数十亿美元的信念。报告称,Llama 4预计将借鉴DeepSeek的某些技术方面,至少有一个版本计划采用一种称为专家混合方法的机器学习技术,该技术为特定任务训练模型的不同部分,使它们在这些领域成为专家。
报告还称,Meta也考虑先通过Meta AI发布Llama 4,然后再作为开源软件发布。
去年,Meta发布了其大部分免费的Llama 3 AI模型,该模型可以用八种语言进行对话,编写更高质量的计算机代码,并解决比以前版本更复杂的数学问题。* 建议主题:
- 人工智能