拉丁美洲将于九月推出理解其独特文化的AI语言模型Latam-GPT | 路透社
Reuters
圣地亚哥,6月17日(路透社)——智利当局周二宣布,拉丁美洲十二个国家联合力量创建了首个能理解该地区特色的大规模人工智能语言模型,其首个版本将于九月发布。
这项名为Latam-GPT的开源计划由智利国家人工智能中心(CENIA)牵头,联合该地区30多家机构共同协作推进。
广告 · 继续滚动智利科学部长艾森·埃切维里对记者表示:“我们相信这将成为人工智能民主化的催化剂,并加速AI在各领域的应用。”
“在智利,我们正从市政层面启动,但为何不展望学校、医院的应用场景?(…)让它们能使用这个非进口且反映我们语言特色的模型?“她补充道。
项目负责人透露,该计划始于2023年1月,各参与方以少量资金启动,旨在修正其他基于英语和全球语境开发的模型常见的准确性不足和性能局限问题。
广告 · 继续滚动官方澄清称,该模型是数据引擎,可基于此开发应用程序及其他解决方案,例如常见的聊天机器人。
“Latam-GPT与DeepSeek或ChatGPT不可相提并论,其产出也截然不同——这不是可供购买的产品,而是将保持开放使用的引擎。“埃切维里强调。
拉丁美洲模式还致力于保护原住民语言,甚至为旅游胜地复活节岛的原生语言开发了首个翻译器,并计划将该技术推广至其他国家的古老文化中。
该项目的语言技术目标包括开发用于公共服务的虚拟助手、个性化教育系统或原住民语言翻译器。目前已在智利多个城市启动试点,以应用本地化解决方案。
从技术层面看,该模型是基于700亿参数的Llama 3版本,其训练依托区域超级计算架构完成,包括智利塔拉帕卡大学的数据中心和云计算资源,并获得了地区开发银行CAF的支持。
尽管缺乏专项推动资金,但CENIA负责人阿尔瓦罗·索托相信,随着系统能力逐步展现,将能获得更多资源支持。
“我们无法与ChatGPT或那些投入巨额资金的企业竞争——无论我们如何筹措资金,都难以达到他们的投入规模”,他坦言。
该项目还与亚马逊云服务和Data Observatory建立合作,从而获得更强大的数据计算能力。
与此同时,CENIA正积极收集整个地区的新数据以训练模型,但也承认加勒比等地区因数字鸿沟问题,数据生成进程将更为缓慢。
- 推荐主题:
- 技术