富士康推出面向AI驱动制造的传统中文大语言模型 | 南华早报
Ann Cao
全球最大电子代工企业、苹果主要iPhone供应商富士康科技集团推出首款基于繁体字训练的中文大语言模型(LLM),这家台湾企业正推动人工智能(AI)在工厂中的应用。
富士康(正式名称为鸿海精密工业)周一发布的声明称,新开发的FoxBrain模型采用"更高效、更低成本"的方法仅用四周完成训练,为台湾AI技术发展树立了新里程碑。
富士康表示,该模型通过120颗英伟达H100图形处理器(GPU)驱动训练,在数学和逻辑推理方面表现优异。
该模型最初设计用于公司内部应用,但富士康表示未来将开源,作为与技术合作伙伴共同扩展应用场景、推动制造业AI化的重要举措。
2024年10月8日,台北富士康年度科技日展出的服务器内部搭载的英伟达GPU。图片来源:路透社
大语言模型是支撑生成式AI服务(如OpenAI的ChatGPT)的核心技术。开源意味着向公众开放软件源代码,允许第三方开发者修改或共享设计、修复故障链接或扩展功能。