编者按:近两年,被称为“21世纪石油”的大数据成为热点话题,并已在生产生活和科研等诸多领域发挥作用,受到发达国家的普遍重视。反观我国大数据产业的发展现状,由于各种行政因素和市场因素,存在数据打通难、数据开放严重不足、数据话语权堪忧等问题。为揭示大数据产业发展受阻背后原因,并提出具有针对性的意见和建议,本报即日起推出“大数据:垄断与割裂”系列报道,敬请关注。
横亘在大数据版图上的一道道部门壁垒,让大数据企业步履维艰。
百度地图是目前广泛使用的电子地图,但由于政府的地图资料信息不公开,企业只能被迫自己采集信息进行标注。
“地图上的公交服务信息应由政府免费提供,但实际上这些信息都没有公开,我们只能挨个跟公交公司谈,不仅资源浪费严重,而且效率非常低下。”百度发展研究中心副主任黄林莉说,政府层面的信息公开距离企业实际需求差得很远。
《经济参考报》记者近日在北京、天津、浙江、贵州等地采访发现,政府运用大数据助力政府治理正进入数据积累和分析的初级阶段,但由于动力不足,部门壁垒森严,存在数据打通难、数据开放严重不足等问题。业内人士呼吁加速公共数据资源的开放,为大数据产业进一步纵深发展营造健康环境。
公共数据垄断加重企业负担
随着大数据浪潮风起云涌,一些政府部门和垄断机构掌握的丰富数据资源成为香饽饽和聚宝盆。然而,大数据企业很难获得这些公共数据,企业日常运营中信息审核成本巨大。
“如果政府掌握的个人征信大数据库对企业和社会开放,将意义重大。”国内大型生活分类信息网站、58同城政府事务部总监曲子恒对《经济参考报》记者说,58同城有5500多名员工,其中3000多名销售人员的主要任务就是审核用户信息。由于诚信机制不足,对于用户信息了解程度有限,销售人员必须耗费大量精力接触商户以保证安全,比如开锁公司、搬家公司在公司网站上发帖,销售人员就要上门进行人工审核。
曲子恒说,目前查询身份信息,每验证一个身份证要交3元钱,增加了企业审核成本;查询企业信息,登录北京工商局网站可以获得一些企业的基本信息,但很多地方信息仍然不公开,不拿着律师证跑到当地工商局大厅就查不到,而且查询还要收费。如果工商注册、身份证查询的大数据系统对企业和社会开放,一些信用记录不良的人一旦发帖,网站就可以根据记录获得风险提示,从而告知商户谨慎交易,企业也不需要花费这么多人力和时间上门验证,能够节省巨大成本。
大数据管理解决方案提供商、龙信数据(北京)有限公司研究中心副主任祁鸣说,政府大数据应用的理念亟待创新,大数据不是人民币,在缺乏挖掘能力的人手里一点用处都没有,但在具有行业经验的人眼里就是一份宝藏。
开放公共数据,既可以提升政府治理能力、推动政务公开,也可以方便百姓生活。腾讯互联网与社会研究院副秘书长谭涛说:“政府开放数据就像向小河注水,会保持河流生态的健康,开放后能带动数据挖掘分析产业的蓬勃发展。现在百度、阿里巴巴、腾讯等大型互联网企业搜集的数据再大也有片面性,如果能与政府数据进行交叉验证,前景将无限光明。”
“现在的问题在于,政府没有动力深入挖掘大数据的价值,而企业又拿不到有用的大数据。”祁鸣说,在我国,一些政府部门拿到其他部门的数据后不对社会开放,先在政府内部共融共通,但事实是政府内部的信息共享都无法实现,更别提对社会和企业开放了。
数据杂乱“放开了也拿不走”
目前数据开放共享主要面临三个方面的问题:一是数据条块分割严重,服务推行困难;二是数据平台缺乏统一标准,“一个部门一个样,放开了也拿不走”;三是一些数据资源丰富的部门不愿共享。
在采访中,多家企业负责人向《经济参考报》记者反映,即使拿到公共大数据,但由于政府部门条线分割严重、缺乏数据存储规范标准,这些数据十分杂乱,分析并加以利用的成本很高。
“很多记录下来的数据没有规范化,也没有对数据存储进行设计,即使在同一个行业,数据也是‘一人一个模样’。”百度大数据部副总裁陶海亮说,存储语言不一样很难融会贯通。例如医疗行业很多信息系统厂商记录下来的数据根本没有统一标准,要想合作,必须先弄清数据含义是什么,这样做成本很高。
对此,龙信数据(北京)有限公司董事长兼总裁李钰说:“拥有者不一定觉得有用,看得懂、用得着的不一定能拥有。政府开放数据需要勇气和决心,并落实到行动上。”
记者调查发现,目前,公共数据条块分割严重,干扰数据汇聚。杭州市经济和信息化委员会副主任杨福颂说,杭州有20多个归属不同部门的信息中心,这些信息中心人为地形成一个个互不连通的“信息孤岛”。天津开发区城市管理局数字城管科科长陈松说,天津政府部门的社区公益服务已在技术上实现了突破,通过智能手机和客户端几乎可以实现零成本的公益活动,但综合管理体系需要工商、税务、社区服务部门的联合,难度较大。
同时,各系统数据标准不统一,开放共享成本大。宁波市智慧城市建设协调处处长聂聪迪说,政府大数据目前没有统一标准,地方和各个系统都在制定自己的数据标准。“地方区域有块上的标准,卫生系统等有条上的标准,条块标准遇到一起需要数据共享,再修改标准将耗费巨大成本”。
此外,部门利益至上,制约大数据开放与应用。天津开发区华纳社区是中央政法委“全国综治信息系统”试点单位,目前全区的残疾人、吸毒人员、重点关爱人群、独生子女等的数据均实现共享,但诸如流动人口、房管信息等数据较难获得。
武汉市信息产业办公室主任黄长清说,武汉市政府机构网站可归为520个数据集,数量已超北京、上海公布的数量,但有些数据资源丰富的单位公开和共享动力不足,给跨行业数据汇聚整合造成困难。
政府公开数据须算经济账
专家认为,开放大数据的作用就像当年实行的“耕者有其田”,这将是生产关系的一次大变革,会促进生产力的大解放。
“作为公共财产的政府数据,本质上属于人民,应该在保障国家安全、个人隐私和企业商业秘密的前提下,让这些数据回到人民群众中去。”中国工程院院士、中国计算机学会大数据专家委员会主任李国杰说。
《经济参考报》记者了解到,美国、英国、日本等发达国家在发展大数据产业之初,便不遗余力地开放公共大数据。美国数据开放网站目前已有超过37万个数据集、1200多个数据工具,这些数据来自170多个机构。英国政府专门建立“数据英国”网站,已将政府开支、政府部门财务报告等数据公开。
李国杰认为,政府应当公开的数据主要分为三类:一是操作业务信息,主要指政府各部门间办公流程所需的数据,如办理银行贷款时所需查询的信用数据等;二是管理信息,主要面向各类业务的管理者;三是研究和决策信息,主要面向政策研究人员、企业管理人员等,主要从数据中发现新规律、新问题,进而制定新政策。
李国杰还提出,政府公开共享大数据,不是单纯登记政府现有数据,而应以公众需求为导向,以促进国家治理变革为目的。同时,要算经济账,不是越多越好,而要能带来信息化成本的节约。英国政府通过高效运用大数据技术,每年约节省政府支出330亿英镑。
提升大数据治理“有所为有所不为”
业内人士建议,在开放公共数据方面,处理好“政府的手”和“市场的手”可以事半功倍。
金蝶国际软件集团有限公司高级副总裁张良杰说,政府开放数据相当于铺路修桥,方便所有人的通行,但不能借此插手大数据企业的经营。政府需要做的是增值服务,比如建设大数据运营服务中心,帮助企业进行人才培训等,其他的则可以放手让企业去做,推动大数据良性生态链的建设,自然形成集聚效应。
李钰说,政府在应用大数据提升治理能力方面要“有所为有所不为”,没必要什么事情都由政府做,可以通过购买服务等形式培育相关产业,发展专业服务。例如,可以推动产学研结合,委托企业、院校研究一些重要课题,围绕着政府公开的大数据做出有意义的成果。考虑制定合理的产业振兴政策,对拥有核心技术和应用方案的企业给予鼓励等。
针对政府各部门和企业普遍反映的政府数据共享和开放问题,《经济参考报》记者在多地采访发现,一些地方政府已经出台法律法规,明确共享边界。杭州市经济和信息化委员会副主任杨福颂认为,数据共享不是无条件的,数据开放共享不应由某个部门说了算,而是由多个部门组成的专门机构调研决定。为打破部门利益藩篱,《杭州市政务数据共享开放指导意见》明确提出,原则上部门不能以涉密为由拒绝数据共享和业务协同,各部门数据是否涉密,由市信息化办提请保密部门予以确认。
一些地方狠抓数据质量,整合信息孤岛。数据质量参差不齐是很多地方政府整合数据时遭遇的突出问题。对此,河南省2009年开展“企业登记数据核查清理”专项行动,对164万户企业、684万卷档案、1.5亿项数据进行补录和更新,建设了统一的大数据库。2010年以来,又核查251.9万户市场主体,清理309.7万卷书式纸质档案,核对1305.5万个数据项。
有些地方新增了数据统一标准。宁波市智慧城市建设协调处处长聂聪迪说,宁波新的体系建设都要求按照新标准进行,旧标准数据能够云化就云化,在协调统一试点个案的同时,注重标准的研究设立。
对于数据开放共享的推进监督,九三学社中央科技委员邬玉良建议,将政府部门间的信息共享纳入绩效考核,建立数据质量评估机制;加强政府与大数据企业的沟通,设计数据采集标准、数据更新频率等;鼓励对政府公开数据的分析应用,吸引相关企业从开放数据中挖掘更多有价值的信息。
|
专家:应走出中国特色大数据治国之路 |
|
须加强核心技术和产品创新,避免重蹈国产操作系统研发覆辙 |
接受《经济参考报》记者采访的多位专家认为,大数据既是资源,也是技术,更是思维方式。大数据最主要的功能特征是预测、比较和实时监控。尽管目前国内外对大数据的定义、内涵和外延尚未统一认识,但普遍对大数据充满期待。
据悉,大数据最简单的定义为大规模数据,基于互联网技术大发展带来的数据大规模增加,以及云计算所形成的强大存储能力和分析能力而产生。美国白宫去年5月公布的《大数据:抓住机遇,保护核心价值》报告显示,2011年全球总数据量为1.8亿亿字节,2013年达到4亿亿字节。
业内对大数据形成的共识是4v特征,即volume容量大、variety数据种类多、velocity产生和更新速度快以及value价值高。
百度大数据部副总裁陶海亮认为,大数据是信息化发展到一定阶段的体现,更多的生活生产以数据形式记录下来。随着信息分析和数据挖掘技术的使用,这些生活数据有了用武之地。
地方官员和业内专家建议,做好顶层设计,转变思维,推动政府部门间数据共享和开放,自主掌握大数据核心技术,走出中国特色的大数据治国之路。
首先,要充分重视大数据发展战略,做好顶层规划设计。目前,全球发达国家多已充分认识到大数据时代的发展趋势,美、英、日、澳等国都提出了国家大数据战略。联合国秘书长执行办公室早在2009年也启动了“全球脉动”(Global Pulse)倡议项目,旨在推动数字数据和快速数据收集和分析方式的创新。对此,九三学社中央科技委员邬玉良建议将发展大数据上升为我国国家战略,制定国家层面的大数据发展计划,通过体制机制创新,盘活政府和社会资源,将数据资源转化为生产力。
国家信息中心研究员宁家骏说,应从国家层面深入研究制定我国大数据资源采集、存储、处理、分析、开发、应用、服务等全链条发展战略和发展路线,从市场环境、技术装备、标准体系、人才培养、政策法规等多方面统筹谋划、综合施策、超前部署,引导和推动政府、企业和社会各界在大数据应用上形成合力、协调发展。
第二,转变大而全思维,鼓励企业单点突破。有专家认为,大数据治国在路径选择上应该转变工业化大而全的思维,按照互联网和大数据发展的内在规律,在发展初级阶段单点突破,追求小而美。
2013年,“杭州政务云”项目建设探索外围助推政府改革的方式,由中标的华数集团承担政务云建设,各部门不再独立购买软、硬件设施,由杭州市经信委整合全市需求统一购买云计算、存储、数据库和应用等基础资源服务,相关的系统开发仍由各部门负责建设。目前,华数集团已完成政务云平台阶段性建设,向杭州22家单位45个项目提供云主机和RDS数据库服务。
第三,完善政策环境,鼓励大数据产业创新。数据交易市场是未来大数据产业发展不可或缺的重要环节,目前全球尚没有成熟的数据交易市场。宁家骏建议,可在全国试点1至2个数据交易市场,形成多级并存的大数据交易市场体系;探索开展大数据的衍生产品交易,建立大数据投融资体系;鼓励社会资本进入大数据投资领域,同时完善大数据投资政策环境和退出机制;抓紧制定出台政府数据开放法规,保证政府数据在风险可控原则下最大程度开放等。
借助大数据治国必须加强核心技术和产品研发,但专家提醒,要避免走国产操作系统研发的老路。事实证明,PC时代依靠政府资金研发的国产操作系统至今无法撼动微软的垄断地位,如今的移动互联时代,要挑战安卓的地位也非常困难。在国内外差距巨大的现实情况下,我国基础软件实现赶超,必须走合作开源之路。
宁家骏认为,政府不应再定向支持某些企业,应变“相马为赛马”、变资金扶持为市场引导,鼓励有创新能力的企业都参与进来,积极利用开源模式和开放社区资源,形成我国大数据产业发展的开源生态系统,尽快实现我国大数据技术的自主自控。