别让AI窃取你公司的数据——《华尔街日报》

Matt Calkins

2023-06-29

我认识的一位金融分析师最近让ChatGPT撰写了一份报告。几秒钟内，该软件就生成了一份尚可的文件，分析师本以为会因此获得赞誉。然而他的老板却勃然大怒：“你把微软所有想法都告诉它了？”

这一幕正在无数机构中上演。创新员工发现人工智能的新用途时，雇主们却在担忧敏感数据泄露。企业逐渐意识到，大语言模型虽强大却缺乏隐私性。在技术能给你宝贵反馈前，你必须先提供有价值的信息。

许多高管不愿做这种交易。他们不愿拿公司最宝贵的资产冒险，更不想训练可能被竞争对手利用的算法。

但若无法调用，资产又有何用？企业数据如同每家大机构地下的金矿，却常以不便的方式存储。大量公司专属资料因组织混乱而实际被浪费，在需要时无法查阅。大型机构的数据资产需要连接技术来实现真正价值——通过吸收企业数据并将其转化为高度可调用的算法，AI可成为这种技术。

鉴于安全顾虑，许多机构不会将数据交给大型科技公司。相反，他们会将AI引入内部，在本公司进行训练和部署。我将这种方法称为私有AI。

这类技术并不难实现。拿一个公开来源的大型语言模型来说，比如StarCoder或Bloom，其中许多模型可以在Hugging Face等市场上获取。然后，用你自己的数据集对其进行训练，你就会得到一个能应对企业所面临情况的得力模型。私有AI可以处理客户通信，并能阅读、路由和优先处理收到的信件。

与所有人工智能一样，私有AI也需要监督。预计在可预见的未来，人类仍将作为编辑和决策者保持主导地位。这项技术可能无法通过图灵测试或为你计划下一次晚宴，但它将帮助企业节省大量时间处理任务，同时不牺牲宝贵的数据资产。随着时间的推移，它可能会像定制软件应用一样：成为企业保持自主和独特性的一种常见方式。

卡尔金斯先生是企业软件公司Appian的首席执行官。

图片来源：Getty Images/Ikon Images刊登于2023年6月29日的印刷版，标题为《别让AI窃取你公司的数据》。