将隐私融入数据挖掘的计划 - 彭博社
bloomberg
摄影:Gremlin/Getty Images如果你在科技行业,特别是美国科技行业,那么你可能对欧洲隐私官员并不太喜欢。德国数据保护监管机构可能会出现在你的噩梦中。
德国是 数据保护法的发源地,该国对欧洲隐私法的执行比其他任何欧盟国家都要严格——只需问问 谷歌(被罚款)、 脸书(被指责)和 微软(StreetSide被删除)关于他们的经历。
是时候认识亚历山大·迪克斯,柏林的数据保护监督者。随着 NSA丑闻仍在发酵,大数据技术在商业领域引发新的 隐私担忧,他和我在这次采访中有很多话要说。虽然迪克斯的立场毫无疑问是强硬的,但并不是不妥协的。
大数据的兴起似乎与 用户隐私。 我们能否兼顾两者?如果我们不打算停止或倒退进步,我们又如何保持隐私呢?
考虑到绝对匿名或绝对安全并不存在,存在更友好的隐私解决方案和不太友好的隐私解决方案。在这方面我并不是完美主义者,但我确实认为未来有可能通过监管来保护隐私。
以匿名化为例。确实,经过一定的技术专业知识和成本支出,匿名数据可能会——如果现在不能,那么将来可能会——与个人关联。这并不意味着匿名化是一个无用的过程。它仍然比在互联网上拥有明确的个人数据或伪匿名数据要好,这在布鲁塞尔正在讨论。
虽然承认情报机构可能总会找到监控个人行为的方法,但我们不应让他们的任务变得太简单。谈到情报机构和监控个人行为,基本问题是像NSA这样的机构不再使用有针对性的间谍活动;他们是在随机收集所有信息。
他们已经停止了有针对性的监控。如果他们这样做,那将更可接受。他们试图 “掌控互联网”,几乎记录每一个动作。这超出了我们——至少在欧洲,尤其是在德国——认为在民主社会中是必要的法律界限。
那么,解决方案是什么——主要是政策的工作,还是人们应该通过 技术手段来保护他们的隐私呢?
我们需要一种混合方案。现在没有灵丹妙药。
一方面,我们需要在国际上达成共识,明确对互联网流量和人们行为的监控应该有哪些限制。应该就哪些数据处理是绝对不允许的达成一致。我知道这很困难,但这是我们需要的第一步。德国前情报局局长实际上呼吁在情报机构之间制定一套关于什么是允许的、什么是禁止的行为的行为规范。
在次级监管层面,应该争取国际隐私保障,例如在《联合国公民及政治权利国际公约》中。这是一个广泛的框架,但将是一个重要的步骤。然后在国家层面也需要采取一些措施。其次,我们需要技术解决方案。我们需要赋予个人用户保护自己通信的能力。因此,没有一个理想的解决方案;我们需要两者结合。
这也是政府支持和资助的事情——例如商业模式或研究,以改善互联网用户自我保护的工具,并可能开发一种 欧洲云模型,这种模型对情报机构的检测更不容易被发现。欧洲企业也可能因此获得 竞争优势。
很多人,特别是在科技行业的人,认为在这个时代隐私基本上已经死了,所以忘掉它吧。他们几乎与你的观点完全相反——你对此有什么回应?
没有合理的隐私保护,就没有可行的创新。创新需要隐私保护,因为相当多的人——至少是一个关键的市场份额——如果不 考虑隐私保护,就会拒绝接受和采用创新技术。
数据保护法规——至少在欧洲——非常重视个人数据的收集,而不仅仅是之后发生的事情。在大数据技术的背景下,你如何看待这种平衡,这些技术大量收集数据 en masse**?**
收集是至关重要的。任何个人数据的收集都会引起合法和非法的关注。它需要防范外部攻击。组织的经济利益也在于限制个人数据的收集,因为这至少会带来成本,并在一定程度上侵犯数据主体的个人隐私。
而且我会质疑大数据是否需要是大个人数据。在研究领域,个人数据往往不是必要的。基本上,我认为你需要对数据的收集进行监管,因为如果你不这样做,你就开始在你的数据池周围建立围栏并试图保护它们——而这通常为时已晚。这些围栏会出现漏洞,并会被技术突破。首先,你总是需要问自己一个问题:你到底需要多少个人数据?
您之前提到过伪匿名化。这能帮到吗?
伪匿名化是一种减少数据个性化的方法。举个例子,您可能作为科学家收集了一组个人数据,并希望在更长的时间内使用这些数据。您希望在三年后再次询问同样的人。
然后,您对这些数据进行编码,为每个数据集分配一个编号,也许还有一个将代码和姓名关联的参考列表,并将此参考列表交给一个受托人。然后,您可以处理这些伪匿名化的数据,并且在仍然是个人数据的情况下,它可能受到的监管会较少。某些通知要求可能不需要遵循。
这是一种非常重要的系统数据保护工具——一种减少个性化程度的方法,从而在没有完全匿名化数据的情况下实施数据保护。它在德国法律中得到了认可,我们一直在努力将这一理念转移到欧洲层面。欧洲委员会甚至欧洲议会——当然也是德国人的Jan Philip Albrecht——已经采纳了这一提案。
然而,已经存在一个危险,因为行业——一些私营行业的代表——试图利用伪匿名数据的概念来限制数据保护立法的范围。他们认为,一旦您拥有伪匿名数据,它就像匿名数据一样。
当您说“行业”时,您是指美国公司吗?
我一直在与德国行业进行交谈。
很多人说透明度至关重要——例如,如果你的数据被秘密服务机构捕获或处理,他们必须在事后的一段时间内告知你。透明度是关键吗?
好吧,德国秘密服务机构原则上有义务在监控结束且没有结果的情况下通知数据主体。除非他们声明这是国家安全问题,而他们通常会这样做。透明度很重要,但再说一次,这并不是灵丹妙药。
你认为这里真的有办法让每个人都满意吗?
我认为最终所需的是妥协。双方都不会完全满意。我仍然相信可以达成妥协,这将导致适合21世纪的法规,至少可以持续10到15年。说下一个30年太过乐观(这正是雷丁在她的提案中所追求的)。我们需要现代化,这一点毫无疑问。
如果你必须将新隐私法规中应适用的基本原则归纳出来,它们是什么?
一个基本原则无疑是,监控电信和任何渠道的对话应该是例外,而不是常规。在我看来,GCHQ和NSA现在都将其视为常规。
第二——这同样适用于私人数据控制者——是数据最小化。数据收集需要受到限制。在开发软件和产品时,隐私设计应该是关键。还有透明度。
这些是支撑当前欧洲数据保护法的相同原则,不是吗?它们足够应对即将到来的挑战吗?
它们仍然有效。所需要的是实际上对这些原则给予更多细节。“隐私设计”是什么意思?如何能促使开发者和制造商采纳这些原则?
最后,您对欧洲委员会想要引入的所谓 “被遗忘权” 有什么看法?
这是欧洲委员会试图实施删除权,删除网络中的个人数据。我认为这是一个合法的目标——如果某人有权删除他的个人数据(如在德国的情况),这不应该在网上受到阻碍。
技术问题在于互联网不会忘记。因此,这是委员会给这个问题贴上的一个理想化标签。“被遗忘权”这个短语引发了一场几乎是哲学性的讨论,尤其是与美国的专家,因为这与言论自由存在冲突——尽管欧洲委员会在草案法规中保障了言论自由。
最终,我们应该有一个新的互联网协议,允许删除个人数据。看看服务 Snapchat。人们希望能够发送会自我销毁的照片。人们有一种基本的需求,不想在网上留下痕迹。
欧洲数据保护法律及其对云计算的影响将成为我们 Structure:Europe 会议 的热门话题,该会议将于 9月 18-19日在伦敦举行。 门票现已发售。
来自 GigaOM 的其他消息
物联网对清洁技术的意义(需要订阅)
Facebook 将在法官批准最终 2000 万美元广告和解后支付每用户 15 美元
Feedly 主导后阅读器世界及来自 Parse.ly 的其他网络出版见解
开发者电子邮件可能确认 9 月 10 日 iOS 7 发布日期