
复旦大学教授 郑磊
我们发现武汉的开放数据平台上面有大量所谓统计报告、图表,比如1到11月份的工业经济运行情况。这种文件的格式不是机器可读的,文件中出现的是基于原始数据做出来的统计结果或产品,并非标准的数据开放。 而在上海政府服务网,我们看到有这样一些停车场数据——全市共有2173个停车场,其中杨浦区和黄浦区各有多少个。这些数据只让我们看到了结果,并不能拿去进行开发利用,也不是数据开放。 此外,还有些地方政府提供了数据查询服务,你可以单条查询数据,但后台的数据集不能看见也不能拿走;有些地方把数据做成可视化或APP应用,这些都不是数据开放。 真正的数据开放看起来没有可视化或者各种应用那么“炫”,在形式上只是一个数据集,横向有字段,纵向有条目。也就是说,数据开放,要开放底层的数据,而不仅仅提供根据数据分析出来的结果或开发出来的产品。从技术上而言,数据开放就是要以机器可读的标准格式开放数据,使数据可以被机器直接抓取和调用;同时,还要在法律上允许数据利用者进行商业和非商业利用,因为这些信息已经不涉及到国家安全、商业秘密和个人隐私了。 为什么做到以上这些才叫数据开放?因为政府在履行行政职能的过程当中,采集和储存了大量数据,这些数据如果没有涉及到国家安全商业机密个人隐私,就应该回报给社会,让数据能够被充分地开发利用、产生价值。开放数据可以推动大众创业、万众创新,实现政府和社会合作共创,推动经济增长社会发展,加快产业升级,实现科学决策,提升公共服务和政府治理水平。 值得一提的是,数据开放要实现非歧视性。这个数据如果可以开放给A公司,那应当也可以开放给B公司;如果可以开放给BAT,就也可以开放给中小企业——只有这样,才能真正促进社会充分利用这些数据,让企业去比谁可以把数据开放利用得更好,而不是比谁更有资源、更有关系。 当然,数据开放根据敏感度的不同也分三个层次。有一些数据比较敏感,不适合向全社会开放,可以只开放给一些特定的组织或结构,比如说科研机构,这叫第一个层次——定向开放。有些数据可以向更大一些的范围开放,比如说开放给政府内部不同的部门,这叫第二个层次——内部共享。有些数据不涉及到敏感问题,就可以向全社会开放,任何人都可以拿走进行开放利用,这是第三个层次——真正的数据开放。 原文PPT:




































