别让AI窃取你公司的数据——《华尔街日报》
Matt Calkins
我认识的一位金融分析师最近让ChatGPT撰写了一份报告。几秒钟内,该软件就生成了一份尚可的文件,分析师本以为会因此获得赞誉。然而他的老板却勃然大怒:“你把微软所有想法都告诉它了?”
这一幕正在无数机构中上演。创新员工发现人工智能的新用途时,雇主们却在担忧敏感数据泄露。企业逐渐意识到,大语言模型虽强大却缺乏隐私性。在技术能给你宝贵反馈前,你必须先提供有价值的信息。
许多高管不愿做这种交易。他们不愿拿公司最宝贵的资产冒险,更不想训练可能被竞争对手利用的算法。
但若无法调用,资产又有何用?企业数据如同每家大机构地下的金矿,却常以不便的方式存储。大量公司专属资料因组织混乱而实际被浪费,在需要时无法查阅。大型机构的数据资产需要连接技术来实现真正价值——通过吸收企业数据并将其转化为高度可调用的算法,AI可成为这种技术。
鉴于安全顾虑,许多机构不会将数据交给大型科技公司。相反,他们会将AI引入内部,在本公司进行训练和部署。我将这种方法称为私有AI。
这类技术并不难实现。拿一个公开来源的大型语言模型来说,比如StarCoder或Bloom,其中许多模型可以在Hugging Face等市场上获取。然后,用你自己的数据集对其进行训练,你就会得到一个能应对企业所面临情况的得力模型。私有AI可以处理客户通信,并能阅读、路由和优先处理收到的信件。
与所有人工智能一样,私有AI也需要监督。预计在可预见的未来,人类仍将作为编辑和决策者保持主导地位。这项技术可能无法通过图灵测试或为你计划下一次晚宴,但它将帮助企业节省大量时间处理任务,同时不牺牲宝贵的数据资产。随着时间的推移,它可能会像定制软件应用一样:成为企业保持自主和独特性的一种常见方式。
卡尔金斯先生是企业软件公司Appian的首席执行官。
图片来源:Getty Images/Ikon Images刊登于2023年6月29日的印刷版,标题为《别让AI窃取你公司的数据》。