过去十年,围绕政府标准化或将信息发布为开放数据的民主和经开放数据运动如济潜力,人们展开了大量讨论和活动。各界政客纷纷赞扬开放数据的问责优势,通过立法并发布行政命令。各组织也纷纷推动开放数据的优势,将其作为政府创新履行使命的关键因素。此外,倡导者鼓励开放数据作为促进经济发展的一种方式,麦肯锡估计,开放更多数据可带来超过 3 万亿美元的经济效益。
虽然开放数据运动取得了一些重大成功——从《数据法案》到data.gov——但我们还没有充分发挥其潜力,甚至没有达到目前的宣传水平。许多有价值的数据仍然在政府内部,尤其是那些开放数据运动如带有个人身份信息或敏感商业信息的数据,或者政府采购的系统不允许共享数据的数据。政府还以电子表格的形式提供大量开放数据,而不是以应用程序编程接口 (API) 等更便于使用的格式提供。事实上,一些最有价值的公共信息根本无法被机器读取,例如金融监管文件。而且,许多已发布的数据并没有真正用于改善私营、非营利或政府部门。
只有诚实地认识到这些障碍
我们才能制定出一个能够实现开放数据承诺的计划。从我在政府和个人机构的开放数据工作中的经验来看,我发现了以下核心障碍:
风险规避:是否以及如何标准化或发布政府数据集的决定具有经济学中标准委托代理问题的所有要素。委托人(这里指公众、立法者,在某种程度上指行政部门领导人)希望数据公开,并将从发布新数据中获得社会或声誉方面的好处。然而,是否标准化或开放数据的决定是由代理人(这里通常是项目经理、信息技术专业人员和律师的组合)做出的。代理人从发布中获得的直接好处很少。但是,如果他们发布的开放数据 董事会成员电子邮件列表 被公开为不准确、有损项目或损害隐私、国家安全或商业利益,他们将面临标准化艰苦工作以及声誉、压力或解雇方面的重大成本。因此,代理人在保持数据封闭方面的错误远远超过委托人的意愿。
二元方法:开放数据的讨论通常以二元术语呈现——数据是开放的(意味着至少它以标准化格式公开,可在网站上下载)或不是。这种思维方式会排除能够以较低成本或风险提供大部分收益的开放数据运动如中间选项,从而导致无法访问大量数据。统计机构的经验表明,中间选项甚至可以访问敏感数据。例如,医疗保险和医疗补助服务中心允许公司申请有限的、安全的交易数据访问权限,以便他们开发创新产品来改善健康结果或减少医疗支出。
技术:采用数据标准或发布数据集是
一项耗时的技术工作,包括从清理数据到决定隐私保护等。各国政府越来越注重确保内部拥有足够的技术专长。然而,在大多数地方,技术熟练的员工仍然是瓶颈,这不仅是开放 建立一个潜在客户生成网站 数据工作面临的瓶颈,也是从技术现代化到数字应用等许多其他相互竞争的优先事项面临的瓶颈。适当发布更敏感的数据集所需的技能更加技术性,需要人们了解高级加密和技术方法,如合成数据和安全多方计算。通常,控制是否开放给定数据集的主题专家不具备这种专业知识,这是可以理解的,因为从历史上看,这并不是必要的,甚至不是有用的特质。
不清楚应该关注哪些数据:
就像发布数据需要兼具主题和技术专长一样,确定哪些数据集应该优先考虑也同样重要。如何使用政府数据需要不同视角的人们发挥想象力。无论他们多么出色,拥有 30 年经验的政 印度号码 府老兵也不可能总是预测哪些数据在他人手中或与其他数据集关联时可能带来变革。(这不是侮辱——拥有 30 年经验的私营部门高管不太可能预测什么数据会在政府中带来变革。)在决定数据共享方式的细节时更是如此。如果人口统计信息被剥离,并且您无法将患者的所有就诊情况关联在一起,退伍军人健康管理局的数据对外人来说仍然有用吗?如果政府为了保护隐私而发布了统计上“捏造”的非常详细的数据,会怎么样?
如果不解决这些障碍,开放数据就永远不会如此普及或具有变革性。
一个可能的答案是集中更多的决策和技术权力,而不是让目前“拥有”数据的数千个办公室做出这些决定和行动。在总务管理局,我们设立了首席数据官来担任这一角色。其他几个机构也做了同样的事情,国会目前正在考虑立法要求每个机构都这样做。然而,我们可以在政府范围内走得更远。国会或管理和预算办公室可以成立一个委员会,由来自各个政治派别、隐私领域、技术背景、私营部门、非营利组织和学术界的代表组成。这群重复的参与者将发展相关的专业知识,并就是否以及如何开放数据做出决定或建议。当一些决定不可避免地被证明是错误时,他们开放数据运动如的组成和流程还可以提供一些大小政治掩护。
此外,开放数据社区必须帮助各机构了解哪些数据最有用,以及在什么条件下最有用。政府没有管理或技术带宽来发布所有可能开放的数据,因此优先排序是关键。如果无法完全开放,团体还需要帮助政府确定下一个最佳替代方案是什么。一些机构已经邀请了这种优先排序,例如卫生和公众服务部的需求驱动开放数据工作,但这种工作必须在整个政府范围内更深入、更广泛。了解外部人士的观点将有助于政府在发布数据和最小化风险和成本之间进行权衡。