数智中国2029|郑磊:避免因短期利益而阻碍公共数据的开放
2024年9月6日,ThePaper研究所召开“2029年数智中国”:邀请朱嘉明、史丹、彭文生、郑磊等知名专家学者参加新一代信息技术研讨会,深入探讨数字经济和新兴信息技术对中国未来发展的深远影响。
复旦大学国际关系与公共事务学院教授、数字与移动治理实验室主任郑磊发表了题为《数据开放、流通与利用的障碍与解决方案》的主旨演讲。郑磊教授认为,公共数据的流动尤为重要,公共数据的开放和公共数据的授权作为两种供应方式,各有其适用的数据类型和应用场景。
下面是郑磊老师演讲的实录。
郑磊教授,复旦大学国际关系与公共事务学院教授,数字与移动治理实验室主任。
报纸记者 周平浪 图
随着中国数字经济的快速发展,数据已经成为生产的关键因素。在推进数字化建设的过程中,政府努力推动跨部门、跨地区、跨层次的数据流动,提高工作效率。然而,公共数据对全国的开放和利用仍然面临许多挑战。公共数据作为主要资源,不仅对政府内部运作和公共服务尤为重要,而且对外部企业和数字经济的发展也具有重要价值。所以,政府正在积极探索“数据开放”和“授权运营”两种公共数据供应方式。
开放公共数据:待客需要“公道”
如果把政府掌握的公共数据比作茶壶里的茶,公共数据的开放就是把政府掌握的数据从“茶壶”中倒出来,让外界社会和公司都可以使用。因为这些信息是通过公共财政支持收集存储的,所以要遵循“取之于民,还之于民”的原则,强调免费直接的供给。
同样是给客人“倒茶”,但难免会面临先有后、浓淡、热冷的局面,会造成不公平。公共数据开放在实际操作中也会面临公平问题。在“倒出”数据的过程中,不同的企业在获取数据的时间、质量和数量上可能会有所不同。这种差异化的供给方式会导致竞争不公平。
为了解决这个问题,有必要建立一个类似“公杯”的机制,即在开放数据的过程中,首先进行数据过滤和均衡处理,提前过滤筛出质量差、安全性和个人隐私相关的数据。同时,过滤到公杯的茶叶温度和浓度也可以均匀一致。在这种情况下,只有把它“倒”给不同的数据需求主体,或者由它来保证公平合理。
从政府的角度来看,“公杯”的设置主要表现在公共数据开放平台上的数据。2009年,美国首次推出Datata国家级政府开放数据平台.gov。近几年,中国各级地方政府也相继建立了超过226个数据开放平台。通过这些平台,公众可以直接下载或通过API获取通过安全审查和隐私保护的数据,以保证公共数据供应的普遍性。
根据《开放数林指数报告》发布的数据,2012年只有三个地方推出了公共数据开放平台,到2023年,这个数字已经增加到226个。其中,上海、北京推广较早,浙江、山东、贵州等省级平台,杭州、济南、德州等市级平台均取得显著成效。就数据集总数而言,2017年只开放了8000多个数据,而到2023年,已经增加到35万个数据。
既有成就,也有挑战。数据开放面临的第一个障碍就是有很多数据,特别是高价值数据仍然“倒不出来”。一方面,政府担心安全,数据开放涉及安全、隐私和商业信息;另一方面,政府意愿不足,数据开放有利于社会、市场和数字经济。但是,对于政府来说,免费提供数据只会增加工作量和负担。一般来说,“不放心,不放心,不好”,导致“供不应求”。
另一个堵点是“流不动”。在供需对接的中间环节,供需政府不知道市场需要什么样的数据,买方公司也不知道政府有什么样的数据,无法提出要求。此外,政府自身的技术开发和运营管理能力有限,导致供需对接困难。由于政府人力和财力的不足,一些需要加工的高价值数据无法持续稳定地供应,也无法完全满足市场需求。“供不应求”和“流不动”的数据对接促使最终数据价值“不能很好地利用”,不能更好地发挥其应有的价值。
数据授权操作:“温碗”赋能新价值
政府掌握的公共数据,如滚烫的热水,在数据开放的过程中,蕴含着巨大的能量和烫伤的风险,如泄露隐私。先将热水倒入“温碗”中介,然后将酒壶放入温碗中。温碗里的热水本身不能倒出来,但可以继续“赋能”壶里的热量。这样,数据本身虽然不流动,而且价值和能量都可以流动,向外释放。这就是数据授权的商业模式。授权运营平台可以通过隐私计算、联邦计算、数据沙盒等技术手段,保证原始数据不出域,数据“可用且不可见”。然而,基于原始数据开发的数据产品和服务可以流通、交易和应用。
以个人医疗保险数据为例。这些信息包括患者的病史和用药情况。虽然对制药公司和保险公司很有价值,但普通公民显然不希望开放这些涉及隐私的信息。但是,如果企业能够了解某一地区疾病爆发的总体情况或疾病覆盖人群的特点,这将为药物研发和保险产品设计提供重要参考。在这种情况下,授权操作可以通过加工产生只涉及整体情况的数据产品和服务,而不泄露每个个体的原始数据,满足企业的需求。
需要强调的是,这种模式是以情景为导向提供的,很多地方都采用了“一情景一审核”的方法进行授权,运营主体需要发挥中介作用。实际上,公司首先要向数据主管机构或运营主体明确指出具体的数据需求和使用场景。经营者从政府机构获得授权,并向企业反馈数据加工所需的结果。这样,数据的价值就可以“供给”了。同时,运营主体除了负责加工和供应数据外,还应促进供需双方的对接,促进合作,从而实现数据价值的有效利用。
但是,数据授权操作也面临着许多挑战。第一,授权管理机制需要明确授权部门、授权目标和授权范围。若授权仅限于单一企业,则可能导致市场垄断、价格不公等问题,这需要保证授权过程的公平性和反垄断性。其次,在授权操作中,还需要明确参与者之间的权利、责任和利益关系,以及如何合理设置数据加工成本,是否应该将收入分配给数据库部门等。这些细节还在讨论中,还没有完全理清。
总的来说,公共数据的价值释放涉及三个核心层面:一是保持安全底线,避免数据泄露涉及中国安全和隐私;二是提高运营商的数据处理和供给效率,保证数据的高质量流通;第三,确保信息共享的包容性、公平性和公平性,确保所有市场主体都能平等获取数据。虽然这三点都是合理的,但是如何在实际操作中平衡这些方面仍然是一个亟待解决的问题。
协同推进开放与运营,平衡创新与安全
数据开放与授权运营在公共数据供应中各有优势和劣势。单纯依靠数据开放很难有效促进高价值数据的安全流动,完全依靠授权操作可能会限制创新的活力,因为其复杂的处理流程和较高的安全要求。为了有效有序地促进公共数据资源的综合利用,结合两者的优势,形成互补协作,在保证数据安全和促进改革创新之间找到最佳平衡。
数据开放强调免费提供公共数据,促进创新,提高集体利益;在保护数据安全隐私的前提下,授权第三方主体将原始数据制作成服务或商品,供特定市场用户使用。为了实现两者的整体协调,应根据数据类型和应用需求采用不同的处理方法。
对于不涉及个人信息、公共安全风险低、社会利益广的数据,应优先考虑数据开放,主要依靠公共财政收集和生成的数据。一般来说,这种数据可以直接提供,而不需要深度处理,带来很大的社会效益。例如,公共交通数据和环境监测数据不仅可以帮助创新应用,还可以提高公共服务质量和公共治理水平。
相对来说,授权运营更适合涉及公共安全和个人隐私,不完全依赖公共财政生成或制作可供企业使用的数据产品和服务的数据。这类数据一般面向特定行业或垂直领域,如水、电、煤等领域的数据可能需要通过授权运营安全有效地利用。
在推进数据开放和授权运营时,应特别注意平衡和协调,避免公共数据开放空间因短期商业利益而被压缩。例如,一些地方政府可能会单方面重视公共数据的快速实现带来的短期收益,并将原本应该开放的数据视为需要授权运营的数据,从而收取费用,这可能会影响公共数据的公平性和可用性,从而提高各种市场主体,尤其是中小企业获取公共数据的门槛和支出,不利于创新驱动和数字经济的长远发展。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com