当今世界是一个由数据构成的世界,而人就是一切数据足迹的总和,这句话恰当地概括出了我们现在所处的数据化世界无时无刻不被数据包围,一切行为和事件都以数据的形式被记录、被储存、被处理。联合国的研究报告显示,全球的数据存量从2005年的150EB(艾字节)增长到2010年1200EB,并预计将以40%的年增长率继续增长,2020年将达到2007年的44倍,平均每20个月翻一番。更直观地,1EB的信息量相当于13亿中国人人手一本500页的书加起来的信息量,5EB则相当于3.7万个美国国家图书馆的信息量。 数据量指数爆炸式增长的同时,数据本身的价值得到了前所未有的重视,奥巴马政府称其为未来的石油。我国政府同样高度重视大数据的潜在价值,由中央到地方铺开了大数据战略布局:国家智慧城市技术和标准试点工作如火如荼;2013年8月,国务院发布《关于促进信息消费扩大内需的若干意见》,引导信息消费推动经济转型;广东省于2012年底就颁布了《广东省实施大数据战略工作方案》,提出到2020年基本建成智慧广东的目标;上海市和广东省先后成立大数据局…… 就挖掘数据潜力而言,政府相对于企业最大的优势在于其作为最大的数据生产者坐拥着最大的数据原矿。对于我国政府来说,身处大数据,势必激发数据活力、挖掘数据红利,最终推进国家治理体系和治理能力现代化。2009年以来由欧美国家兴起的政府数据开放运动则为这新的重要议题打开了一扇窗户。 何为政府数据开放? 政府数据开放顾名思义,即不受著作权、专利权以及其他任何限制,将政府掌握的各类数据库、数据集公开,供社会各界查询、下载、应用。该运动一方面源于互联网上的软件开源运动向数据开放运动的转变,另一方面源于社会各界对于政府信息公开的呼声此起彼伏。美国首席信息官维伟克昆德拉将这喻为数据民主化的运动。 数据开放落脚于实现公共资源的增值再用,为社会、为国家、为民众提供更加优质的公共服务。而政府管理过程中存在创新性和竞争性不足的局限,提取政府数据价值最好的办法应是充分挖掘民间智慧,引导公共部门外部开发大数据工具和应用,改善现有的管理方式和思路,从而提高社会运行效率,这本质是由单纯的政府管理向多元主体治理转变,充分契合了十八届三中全会深化改革的思路。 全球数据开放运动情况如何? 致力于开放数据运动的开放知识基金会发布了2013年的开放政府数据普查结果,包括交通时刻表、政府预算、政府支出、选举结果、公司注册信息、国家地区、国家统计、立法、邮政编码、污染物排放等十个领域指标,涉及了70个国家和地区政府的数据开放情况。 在全球范围内,建立统一的数据开放门户网站是各国普遍的做法。从内容上看,重点开放可机读的数据集(DataSets)、应用程序(APPS)等资源,有的还专门设置了供开放人员参与和公众反馈的专栏。从覆盖范围上看,主要是全国性的,部分地方或部门建立独立的数据开放网站。从数据集的形式上看,以CSV、HTML、XLS、NII、PDF等一种或多种格式出现。 美国是数据开放运动的起源地。美国的数据门户(data.gov)在2014年1月全面改版,截至2014年2月10日,网站上共开放了88137个数据集、349个应用程序、140个移动应用、参与的部门达到175个;同时还有40个州、44个县市建立了单独的数据门户。美国的数据开放格式多达46种,其中应用最广的格式是HTML、ZIP和XML这三种,数据集分别有20775个、12517个和11992个。 而英国的数据开放门户网站上,共开放了13670个公开的数据集以及4170个非公开的数据集。此外伦敦、曼彻斯特等地以及索尔福德市议会等16个地方和部门还建立了独立的开放数据门户。 我国政府数据开放情况如何? 在全球范围内,目前中国的数据开放程度相对不高,水平相对落后,但是已经迈出了坚实的步伐。 国家层面上,2013年9月12日,与欧美国家的数据开放网站类似的新版国家统计数据库正式上线为公众提供数据服务,目前入库的数据近600万笔,比原来增加了3倍,数据涵盖社会经济的方方面面,既包括了国家统计局生产的主要数据,也包括了有关部委生产的其他数据,还与主要国际机构数据库网址集成对接。 地方层面上,上海、北京等主要城市率先开展数据开放工作。上海建设了国内首个地方数据开放网站上海政府数据服务网,提供9家试点单位的212项数据产品、30项数据应用可下载,涵盖地理位置、道路交通、公共服务、经济统计、资格资质、行政管理等6大领域,如市住房保障管理局开放了保障房工程信息、房地产开发、房地产经纪企业信息等数据产品。继上海市之后,北京市开设政府数据资源网,目前已有29个部门公布了400余个数据包,点击量最高的是由北京市国土资源局提供的土地用途分区数据集,截至2014年6月23日已被下载1045次。此外,青岛等电子政务较发达的城市纷纷开展数据开放工作。 缘何开放政府数据? 数据的开放是为了更好地开发应用,服务民众。截至2011年12月,仅仅在美国的Data.Gov网站上,就汇集了1140个应用程序和软件工具、85个手机应用插件,其中有近300个是由民间的程序员、公益组织等社会力量自发开发的。近日,北京市信息资源管理中心组织举办了北京市政务数据资源网应用创意大赛,以此吸引更多的企业和个人更充分地挖掘出政务数据资源的价值。目前北京市政府数据资源网上可供下载使用的应用程序全部直接为民众提供便利,例如爱健康应用是北京市所有卫生保健设施的指南应用,包含北京市各级医院、社区卫生服务中心、妇幼保健院、体检医疗机构等,用户可以使用GPS功能定位附近的医疗机构信息。 数据的开放将进一步推动社会治理多元主体的成熟,提高社会运行效率。例如就食品安全问题,美国联邦政府整合相关部门管辖范围内的问题商品的召开记录,开设专门的商品召回查询网站和手机系统,一方面供民众查询,另一方面供民众举报问题产品,这就充分发动全社会的民众监督食品安全,大大减轻了食品监管相关部门的行政成本和工作压力,更大大提高了食品监督的工作效率。 如何开放政府数据? 与欧美国家相比,我国政府在数据开放上拥有一些独特的优势。从数据量来看,我国庞大的人口基数本身就意味着无穷无尽的数据源,更为重要的是,我国政府在社会体系中的地位、能力和影响力比欧美国家政府大得多,这意味着我国政府拥有的公共数据资源更为庞大。从处理数据的能力来看,我国在未来将拥有世界上最大的知识群体,在培养下一代数据科学家方面,拥有无可比拟的人才优势。 在下一步数据开放部署中,我国政府应做好三件事。 首先要明确数据开放的原则是什么。Web2.0之父蒂姆奥莱利曾制定了开放公共数据的8条原则性规定完整性、原始性、及时性、可读取性、机器可处理性、获取无歧视性、格式通用性、无许可证性。这8条规定可作为重要参考,因为目前我国政府公布的数据基本都是报告和报表,没有标准的格式,处理痕迹明显,大多数不能够以数据的形式查到,同时出于保密性考虑,获取渠道单一,可获取的仅为冰山一角,因此也无法深入分析、加工和挖掘。 其次,我国政府应明确什么样的数据能够开放。 第一,开放的数据应是原始的。有的人主张开放经过加工和解释的数据,但是这就与基本原则相悖。此外这样的主张会衍生出两个问题:一是各部门应该加上什么程度、多少梳理的说明、解释和观点,行政部门的工作量无形中增加,可能产生反面效果;二是经过加工和解释的数据很可能掩盖了数据原本的本质。因此,开放的数据应是最原始的,我国政府在引导之外,更应该鼓励企业、个人、公益组织等多元治理主体最大程度利用原始数据发出自己的声音。 第二,开放的数据应是粒度最小、最细的。文字经过组合可以变成词语、短语、句子,甚至是华丽的文章。数据也是如此,应该以粒度最小、最细的数据格式呈现出来,让不同的用户各取所需,自由组合,最大程度发挥数据的潜在价值。 第三,开放的数据应是高价值的。所谓高价值的数据即为社会最需要的数据,昆德拉对此定义凡是能增强公众对政府部门的问责能力和政府部门的反应速度、提高公众对于政府机关及其运作的了解、推进部门的核心使命、创造经济发展的机会或者满足公众特定要求的数据,就是高价值的数据。 最后,我国政府应明确要采取什么样的措施来推动数据开放。 第一步是建立统一的数据开放网站。有必要的情况下可以建立部门系统、地方的数据开放平台。将割裂储存于不同地域、不同层级、不同部门的数据在统一平台上开放,消除政府部门间信息孤岛,最大程度汇集数据,为数据开发人员提供最齐全的原始数据源,使政府数据的附加价值被充分发掘。 第二步就是要提供尽可能多的原始数据。只要不涉及隐私和国家安全的数据全部开放、开源,允许公众免费查询、下载,给予个人和企业以最大自由度重新处理这些数据,使公共数据与民间和企业界拥有的数据资源相互融合,形成巨大的知识创新力、财富创造能力和社会进步推动力。 第三步是通过各种方法鼓励公众重新处理政府数据。例如在数据开放网站上提供应用程序开放接口,再如举办应用程序创新比赛,这两种方法是如今比较流行的做法,鼓励相关IT行业公司自行深入开发应用,激发有能力、有精力的个人(尤其是高校学生)的创新热情,创造更多的社会价值和商业价值。 数据是未来的黄金,政府坐拥最大金矿。开放数据的益处无须赘述,在全面深化改革的进程中,加快数据开放的步伐,充分挖掘民间智慧,培养多元治理主体,才能最终实现国家治理体系和治理能力现代化。数据开放的未来值得所有人期待,因为你我必将会成为这波浪潮的践行者和受益者。
信息发布:广州名易软件有限公司 http://www.myidp.net
|