右下象限中还有另一组例子,它们将自愿提供的数据联系在一起,但主要是为了公众利益,这些例子来自许多伟大的公民科学例子。这可能包括家庭共享空气质量数据;患者共享自己的碳排放数据等等。在这里,重要的是这些安排要符合数据共享的自愿性质;它们应该是开放的、方便的,公民可以使用,研究人员和政策制定者也可以访问。
我们确信这份清单并不全面。但我们希望它已经证实了所需的响应的多样性,并将促使其他人提出自己的解决方案。
有些类型的数据特别复杂,横跨图表的多个象限。基因组信息可以说位于价值轴的中间——它具有很高的个人价值,可用于定制健康治疗,但也有很大的公共价值,可用于理解大规模模式(与健康结果和祖先有关)。在最大化公共价值和维护个人隐私之间取得适当的平衡尤其困难,因为 DNA 序列是独一无二的(同卵双胞胎除外),这意味着 DNA 样本永远无法真正匿名。
学校数据是另一个有趣的例子。英国一直在收集各种类型的学生数据——关于表现和许多其他指标。这将对学生本身产生直接价值,对研究和任何提供机器学习工具帮助学校进行评估或课程的提供商都具有价值。这种潜在价值的多样性使得关注信任变得更加重要。例如, inBloom在美国改善教育的努力失败了,部分原因是该公司因在将个人学生数据从学区 自雇数据 数据库转移到自己的数据库之前没有征得家长同意而受到批评。
对于永远无法完全开放的高度敏感的个人数据集,将其匿名化(通过密码学的进步)或用合成数据替代个人数据可能变得越来越可能——这已经在荷兰用于创建整个城市的“数字孪生”。有前景的技术包括差分隐私,它已经在美国人口普查中试用(尽管成功有限)。DECODE 项目也在试验同态加密,作为从加密数据中获取见解的一种方法。但即使是使用合成数据,也应该与强有力的法律保护和公共问责相结合——正如华盛顿大学的研究人员之前所主张的那样。
5.1 信任:信任对象和信任原因
之前引用的 ODI-YouGov 调查显示了公众对信任的态度。大多数英国消费者(64%)信任 NHS 和医疗保健机构,信任他们持有的个人数据,排名高于银行(57%)、地方政府(41%)和在线零售商(22%)。当今,全球范围内对信任态度的比较表明,不同国家和不同时期的信任态度差异更大(例如,对警察的信任通常高于对其他政府部门的信任)。
这些模式反映了多种因素:感知能力、道德操守、直接经验等等。不同社会群体的态度也各不相同。例如,年龄对我们分享个人信息的舒适程度有很大影响。例如,在我们 2018 年的 Nesta 民意调查中,表示愿意分享个人数据以改善公共服务的人数在 18-24 岁人群中跃升至 79%,但在 55-64 岁人群中下降至 68%。
这份名单上的所有组织和行业都经历过信任度下降的时期和重建的时期。关键在于,信任需要不断赢得,而且不是泛泛而谈:信任是做特定事情和在特定时间的信任。任何新机构都需要展示成功举措的记录,这些举措提供了可证明的价值;对其所做的事情有出色的沟通和宣传;有充分的证据证明他们谨慎地做出正确的决策;领导层中也有受人尊敬的人物。
现在,关于如何最好地设计新机构以增强公众信任的健康辩论已经拉开帷幕(正如阿达·洛夫莱斯研究所 (Ada Lovelace Institute)最近发布的报告所言,该报告呼应了我们的观点,即数据信托需要以能够建立信任的方式进行设计,而不是像政府中上一代数据和数字团队那样,成为技术官僚或内向型机构)。
6. 寻找共同语言
任何数据讨论中的一个重要挑战是使用正确的术语。一些广泛使用的术语可能会阻碍而不是阐明选择。一个关键的例子是使用所有权和财产的语言。这些术语似乎直观清晰且相关,并导致一些人希望将数据货币化——因此,如果我同意分享个人数据,我应该为此获得报酬。
但仔细观察,所有权这一术语就没多大意义了。与石油或其他实物商品相比,数据无处不在,几乎是无限的,而且没有竞争性。它更像是一个元素,而不是一个对象,就像事实信息和抽象概念永远不能被任何个人“拥有”一样,数据也不能——它在概念上与作者身份是分开存在的。同样,许多人认为数据实际上更像是一种公共产品,而不是私人产品(例如,参见Diane Coyle 教授最近的这篇博客)。
数据的价值往往不是通过积累而增长,而是通过链接和分析而增长。它的价值不是由它周围的边界强度决定的,而是由它所拥有的链接数量决定的。重要的是谁在收集信息、谁在控制信息以及谁在使用它。重要的分析点是区分“拥有数据所有权”和“访问和控制数据的权利”。
但即使是“数据权利”也可能是模糊的,无论是从法律还是道德的角度来看(例如,我对可能帮助世界阻止流行病的个人健康数据拥有什么权利?)。正如我们试图在上述框架中展示的那样,答案总是取决于具体背景和用途。
然而,这种多样性可能受益于共同的标准,就像互联网的多样性取决于 TCP/IP 协议和 URL 一样。标准(可能像前面提到的芬兰的IHAN一样,旨在让公民更好地控制数据使用)可以降低与新设计相关的交易成本,并使受信任的机构(如政府或银行)更容易保存有关您的信息,同时您仍然拥有对这些个人数据的特殊访问权限,这样您就可以决定如何处理这些数据。GDPR 是朝着正确方向迈出的一步,但任何未来全面的“数据权利法案”都必须比当前的建议更加详细。
结论
这篇简短的论文试图开启关于数据治理的部分辩论,建议如何实现双重目标:让公民拥有更大的控制权,并为整个公众带来更大的价值。它提出了需要设计和试验的各种不同解决方案。
扩大这里列出的机构群体需要时间。还需要采取积极行动,培养良好运作这些机构所需的技能(考虑到私营部门的薪酬和需求,这是一个巨大的挑战);以及就利益、风险和权衡展开更细致的公开辩论。
但这项工作早就该做了。长期以来,普遍存在的意识形态偏见阻碍了新公共利益机构的建立。这导致我们面临巨大的不平衡,一方面是强大、富有、具有全球影响力的私人组织,另一方面是少数非常弱小的公共组织。现在需要纠正这种不平衡。