台湾建立自己的AI语言模型“Taide”以对抗中国的科技影响-彭博社
Jennifer Creery
当被问及谁赢得了最近的台湾总统选举时,世界上最先进的中文聊天机器人给出了令人困惑的答案。
“赖清德,”百度公司的Ernie Bot准确地说道。但随后它补充道:“无论台湾的局势如何变化,基本事实是只有一个中国” — 这一评论回应了美国友好候选人赢得了成为中国希望有朝一日统治的岛国下一任总统的竞选后,北京外交官所说的话。
对于本应是直截了当的问题和答案出现政治倾向,这对台湾来说是一个问题,台湾官员担心来自中国的有影响力的科技平台,如抖音和小红书,正在侵蚀该岛国的文化和政治基础。
为了减轻中国日益增长的科技影响力并在新兴人工智能生态系统中建立立足点,台湾通过2026年预算了约174亿新台币(约合55.56亿美元)来发展行业专业知识和工具。此外,它还在可信人工智能对话引擎(Taide)上投入了约740万美元,该语言模型的开发者表示,它将为企业、银行、医院和政府办公室提供写邮件和会议总结等任务的平台。希望这一工具能摆脱中国的政治影响。
李育杰,国立交通大学应用数学教授,泰德项目协调人,表示台湾需要“一个与我们价值观一致的大型语言模型。”“一个大型语言模型嵌入了一个地方的知识体系,更重要的是,它的核心价值观:自由、民主、人权,”他说。
参见: 抖音网红为习近平在台湾赢得罕见软实力
这个自诩为“硅岛”的地方已经在人工智能发展中扮演着关键角色,因为它最大的公司,台湾积体电路制造股份有限公司,生产最受追捧的加速器芯片。根据台积电首席执行官魏哲家的说法,它是Nvidia Corp.的首选人工智能芯片制造商,也是整个人工智能创新浪潮的“推动者”。推动国内语言模型和相关软件和工程生态系统的发展旨在将台湾推向更高的发展链。
为了实现这一目标,泰德的开发人员正在从当地媒体和政府机构获取许可内容。然后将这些材料添加到Llama 2,Meta Platforms Inc的开源大型语言模型上。这种方法的一个好处是内容将采用岛上2300万人使用的繁体中文,而不是中国所使用的简化版本。泰德的早期版本预计将于今年4月推出,供选择合作伙伴进行测试。
Taide 在范围上有限,与 ChapGPT 等产品相比——而其资金与 Meta 和 Microsoft Corp. 等公司投入的数十亿美元相比显得微不足道——但开发者们希望该工具和其他本地开发的人工智能计划的其他方面,有朝一日能够使台湾在软件行业发挥更大的作用。
虽然 ChatGPT 确实有中文选项,但对台湾的需求来说并不理想。一个关键原因是政府和公司不希望将私人数据放入 OpenAI 平台。
去年,三星电子公司员工将敏感代码上传到该平台后,对数据安全和人工智能的担忧被强调。这也是台湾华硕计算机公司计划推出一个人工智能计算平台的主要原因,该平台将在客户设施中安装所有硬件。
Taide 的开发者们还表示,他们的最终产品将允许安全处理和存储敏感的银行、医疗和官方信息,尤其是因为这些信息将存储在台湾的服务器上。
| 阅读更多: |
|---|
| * 台湾选出亲美总统,蔑视中国的警告 * 独立将意味着战争,中国警告台湾领先者 * 监管人工智能?美国、欧盟和中国的做法:简介 * 华硕将出售 Nvidia 人工智能服务器,您可以在办公室安装 |
台湾的模式不必与ChatGPT等领导者的实力相匹配才能有效,它的建造者们说。“要把整个行业提升到一个新水平,足够好就足够了,”国立台湾大学计算机科学教授、台北玉山银行首席技术官Jyh-shing Jang说。Jyh-shing Jang,他还担任台北玉山银行的首席技术官。
“公司可以将Taide用作原型,然后尝试微调模型并提炼,直到足够小以至于可以放入您的笔记本电脑或手机中,”Jang说,他对该项目很熟悉,因为该银行已同意向其提供非个人数据。
对AI项目的聚焦标志着台湾的转变,台湾科技产业主要由台积电等硬件制造商主导。虽然该岛屿的公司深度参与AI产业,但几乎完全是从硬件角度出发。
“我能理解这是如何产生的,即‘嘿,我们没有百度、华为、OpenAI或谷歌的等价物,所以我们需要通过尝试在系统内部工作来提前做到这一点,以免被其他模型淹没,”Albright Stonebridge Group的技术政策负责人Paul Triolo说。
“但这并不是一场轻松的游戏,”他说。“着手进行这项工作将需要大量持续的努力和资源。”