小型初创企业将本土AI引入蒙古,避开中美主导地位——彭博社
Saritha Rai
巴塞罗那MWC25科技展上的人工智能(AI)标志。
摄影师:Angel Garcia/Bloomberg 欢迎阅读《科技深度解析》,这是我们每日发布的时事通讯,汇集了彭博社全球记者关于科技行业的报道与分析。今天,Saritha Rai将带您了解蒙古国一家AI初创公司及其自主研发大语言模型的惊人进展。
全球科技动态
**华盛顿邮报遭黑客攻击:**华盛顿邮报正在调查针对部分记者邮箱的网络攻击事件,该报已因此加强网络安全防护。
**WhatsApp引入广告:**Meta将开始在WhatsApp即时通讯服务中展示广告,在重金投入人工智能等长期项目的同时,开辟新的潜在收入来源。
**三星的医疗健康野心:**三星计划开发一个中心平台,让用户能在就诊间隙直接与医生共享健康数据,加剧技术驱动的医疗健康领域竞争。
估值更新
面向风投机构及其他私募投资者的软件服务商Juniper Square已融资1.3亿美元,本轮估值达11亿美元。新资金将用于业务扩张及增强该初创企业的人工智能能力。
充满挑战的征程
蒙古——这片拥有广袤草原、丰富矿产和游牧传统的土地,已毅然投身人工智能竞赛。这个蕞尔小国的一家初创企业成功开发出完全基于蒙古语训练的本土大语言模型,在成吉思汗的故乡创造了技术里程碑。成吉思汗。
蒙古AI新锐Egune已跃居该国科技领域顶峰,在全球巨头主导的领域开发基础模型。虽然估值达3850万美元,但其崛起更关乎发展势头而非资金。这家初创企业堪称异数——作为少数来自小国的AI企业,它不仅在硅谷(以及近年北京)主导的世界中逆势生存,更构建起捍卫国家身份与主权的人工智能模型。
蒙古首都乌兰巴托。摄影师:SeongJoon Cho/彭博社Egune上月从蒙古顶级商业银行戈洛姆特银行融资350万美元意义重大。正如创始人兼首席执行官巴德拉尔·桑利格所言,尽管蒙古创业生态繁荣,但99%的初创企业都难逃夭折命运。
在OpenAI于2022年11月高调发布ChatGPT引发全球生成式AI模型与产品研发热潮仅数周后,Egune就启动了基于蒙古语数据集的基础大模型研发工作。基础模型具有多功能性,开发者可针对编程、医疗分析或客服等具体应用进行微调。
蒙古,这个拥有350万人口的国家(约为GitHub平台上印度开发者数量的五分之一),出人意料地跻身主权大语言模型排行榜。去年,该国在全球人工智能准备指数中位列188个国家中的第98位,较前一年上升了11个名次。与许多国家一样,蒙古宣布了国家人工智能战略,今年2月宣称其目标是到2030年成为地区AI领导者。未来五年内,该国计划培养250名AI专家。
在人才极度匮乏的情况下,由软件和AI行业资深人士桑利格(拥有20年经验)领导的Egune团队汇聚了11位AI专家,其中多数为海外留学的蒙古人。这位在德国受训的企业家回国后着手攻克复杂技术难题,为资源稀缺的蒙古语实现了96%准确率的自动语音识别系统,并为该国95%人口使用的语言开发了语法检查算法。这些数据集在构建Egune时派上了大用场。
Egune AI创始人兼首席执行官巴德拉尔·桑利格。图片来源:Egune AIEgune AI于2023年首次公开亮相,其模型部分采用合成数据(模拟真实世界信息的人工生成数据)进行训练以增强鲁棒性。去年,这家初创公司发布了拥有300亿参数的模型(作为对比,OpenAI模型参数估计超过1万亿),仅用96个图形处理器(支撑AI工作负载的核心芯片)耗时八周完成训练。
几周前,这家初创公司发布了最新成果——通过整合国际公开数据集构建的700亿参数通用大语言模型。该模型在蒙古语语法和语义处理上超越了ChatGPT,在广泛任务中展现出更优的准确度。
Egune的崛起并非一帆风顺,最严峻的挑战是GPU短缺——这是AI训练的命脉。尽管拥有128块炙手可热的英伟达H100芯片,组成了蒙古国内最大的计算集群,但相比谷歌母公司Alphabet和OpenAI等巨头的算力规模仍相去甚远。蒙古全国仅有两座数据中心,另一处规模更小的集群设在桑利格的母校蒙古科技大学。
团队还需说服公众这是真正自主研发的模型。许多人猜测这不过是OpenAI的GPT变体或Meta开源Llama的改造版。颇具讽刺的是,他们发现对英文训练的Llama进行蒙古语微调反而更困难——进展缓慢、数据需求激增、算力成本飙升,最终证明从零开始构建才是实现真正本土化AI的必经之路。
近期融资成功增强了Egune的公信力。目前该公司正在开发多款产品,拥有包括政府机构在内的数千名付费用户。其模型驱动着覆盖95%人口的喀尔喀蒙古语聊天机器人Eva,为电信运营商Mobicom和龙头银行Golomt提供自动化客服支持。
这一切的发生正值"主权AI"成为人工智能行业的重要主题,全球多国将其列为国家优先事项——政府希望医疗保健和金融服务等关键行业由本国境内的人工智能系统控制和运营。随着中美在AI领域主导地位的影响日益显现,各国都希望掌控数据、话语权和关键基础设施。
近期事件凸显了相关风险。OpenAI切断了对中国、俄罗斯等国的模型访问权限。中国使用国家控制的AI模型审查信息(例如删除涉及天安门广场的内容)引发了人们对内置管控的担忧。当中国AI巨头阿里巴巴、字节跳动和腾讯关闭图像识别和即时问答功能以防止高考激烈竞争中的舞弊行为时,非洲多地的AI工具随之瘫痪,这引发了建立主权AI的呼声。
对于Egune公司和蒙古国而言,前路艰难。基础系统需要强大的数字基础设施才能扩展。例如Egune的AI模型推理算力已达上限,客户需排队等候。本土模型必须解决现实应用问题,比如通过AI监测改变传统畜牧业方式,构建预测性AI模型以增强气候适应能力,同时保持游牧传统。
Sanlig认为每个国家都应拥有主权AI。他表示否则世界将充满不平等,因此他主动帮助哈萨克斯坦等邻国构建自己的AI模型。
引用
“可能傲慢也可能才华横溢——我认为是前者。但值得投资。”
杰西卡·利文斯顿
Y Combinator合伙人
描述她2016年对Scale AI联合创始人Alexandr Wang申请创业加速器计划时的反应。Meta Platforms上周同意向Scale投资143亿美元,Wang加入了Meta CEO马克·扎克伯格的"超级智能"团队。### 阅读
科技与娱乐领域当日最热文章
唐纳德·特朗普总统的家族即将推出特朗普品牌移动通信服务,该服务将依赖"美国制造"的无线网络和硬件。目前尚不清楚他们将从何处采购大量完全在美国制造的硬件。全球主要手机制造商中几乎没有——如果有的话——大规模完全组装设备在美国本土进行的。
动态
- 4.72亿美元播客创作者在Patreon上产生的收入总额,该平台已成为视频创作者和播客提供付费订阅独家内容的流行平台。Patreon表示将从8月4日起对新创作者的分成比例从8%提高到10%。
AV俱乐部
1X Technologies首席执行官Bernt Børnich做客彭博科技频道,讨论该公司帮助其人形机器人学习在物理世界中移动的新模拟器。
更多来自彭博社的内容
获取科技深度解析以及更多彭博科技新闻简报,直接发送至您的邮箱:
- 网络公告 - 报道黑客与网络间谍的隐秘世界
- 游戏进行时 - 深入探索电子游戏产业
- 开机启动 - 获取苹果独家消息、消费科技新闻等
- 荧幕时光 - 前排围观好莱坞与硅谷的碰撞
- 声音片段 - 报道播客、音乐产业及音频趋势
- 问答AI - 解答您所有关于人工智能的问题