大咖访谈|大数据产业的春天何时到来?(上)数据开放之路

2020-05-11 13:26
作者:
来源:


背景介绍

4月9日中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,其中一大亮点是数据作为新型生产要素写入中央文件。继去年11月中国共产党十九届四中全会提出,数据可作为生产要素按贡献参与分配后,《意见》是首次勾勒数据生产要素的基本政策。

作为新型生产要素,数据被写入中央文件有何深意?《意见》中所提出的举措又该如何落实?针对这些问题以及《意见》出台后中国的大数据产业发展及数据监管走向,我们采访了励讯集团中国区高级副总裁张玉国先生。



嘉宾简介



1.jpg

励讯集团中国区高级副总裁张玉国先生


张玉国自2012年起担任励讯集团高级副总裁。此前的五年间任爱思唯尔(励讯集团子公司)中国区总裁。2010年他创立了在华国际出版商版权保护联盟(IPCC)并担任常任主席。加入励讯集团之前,曾供职于中央某机关,从事出版管理工作长达 12 年。2002 年至 2003 年,曾以访问学者身份赴加拿大参加“中加学者交流项目”(CCSEP),先后在渥太华大学和西蒙·费雷泽大学(SFU)学习。主要研究领域为文化产业与文化政策,曾出版《国家利益与文化政策》、《文化产业与政策导论》和 《文化多样性与人类全面发展》(译作)等著作。



本期要点提炼




要从抓住第四次工业革命发展机遇的高度来理解发展大数据产业的重要性和紧迫性。



中国大数据产业的春天就要来了,但现在还处于“乍暖还寒”的时期。



中央文件高屋建瓴,能不能执行好,重点是抓落实。政府和企业都有责任。



中国一定会发展成为全球最大的大数据市场。其中人口规模、技术领先和超强的国家能力(顶层设计和执行力),是中国大数据行业得天独厚的优势。



现在政府数据开放共享不尽如人意,原因是“三不”:不敢、不愿、不会。最大的困难是突破“不敢”。



中国大数据产业发展比较成熟的一个标志,就是出现有国际竞争力的大数据专业企业。



大数据立法领域,中国应该实现从学习者、遵循者到制定者、参与者的转变,要从跟跑、并跑到领跑。



要在安全和发展中找到平衡,建立公开透明的大数据交易市场,防止数据黑市、灰市。


01. 《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》(以下简称《意见》)对外公布, 这一次,数据作为一种新型生产要素写入中央文件中,与土地、劳动力、资本、技术等并列为生产要素之一,体现了互联网大数据时代的新特征,引起了大数据、人工智能及云计算从业者的普遍关注。您对数据纳入生产要素这一中央决策有着怎样的解读?


张玉国:我感觉这份文件非常重要。我的朋友圈有人说已经学了三到四遍,都感觉非常重要。有人甚至将其与十八届三中全会关于改革的纲领性文件相提并论,可见文件的影响力。我也认真学习了文件,从一个大数据企业从业人员的角度,谈几点心得:


(一)文件有高度、有创新。数据与土地、资本、劳动力、技术几大生产要素并列的提法,第一次出现在去年的十九届四中全会公报中,但并未做更为深入的阐述。而这一次中央文件对此详加阐述,我觉得这是我们国家领导层把握世界发展大势和中国目前发展阶段而得出的结论,有理论创新意义。英国《经济学人》杂志曾发表过一篇文章,指出“数据是新的石油(data is the new oil)”,把数据与重要的能源并列,可见对数据重要性的认识也是世界共识。

2.jpg


(二)要从抓住第四次工业革命发展机遇的高度来理解发展大数据产业的重要性和紧迫性。最近疫情期间时间相对比较宽松,我系统地读了世界历史和科技史方面的书。纵观人类历史,经历过三次工业革命:第一次是18世纪60年代的机械化革命,以瓦特改良蒸汽机为代表。第二次是19世纪末的电气化革命,以爱迪生发明电机和电灯为标志。第三次是20世纪40年代年代以来的信息化革命,以计算机、微电子和数字通信技术的发明为代表。每一次工业革命都带来了生产力的飞速提升,经济快速发展和人民生活水平快速提高。哪个国家能抓住工业革命的机会,国力就会迅速增强,反之就会被淘汰。我们中国有个说法叫“百年屈辱史”,说的是从1840年以来的这段落后挨打的近代史,其实最根本的原因就是错失了前两次工业革命。第三次工业革命我们赶上了一个末班车,发展已经不可小觑。


 我读《国富国穷》一书时深有感触:1500年代以前,中国的技术和文明发展都是毫无疑问的世界第一,在这之后西方文明逐渐主导了世界500年。其序幕可以说是从1492年哥伦布发现新大陆开始的,标志着地理大发现。但是大家都知道,早在1405-1437年间,郑和曾经7次下西洋,当时中国的造船技术独步天下。举个例子,1405年郑和第一次下西洋带了317艘船,28000人,其旗舰座船(宝船)长400英尺,宽160英尺。而九十年之后的1492年,哥伦布的旗舰Santa Maria号规模只有其四分之一。葡萄牙人达·伽马在1497年绕过了好望角,从另外一条路发现了印度和东南亚,当时他的船队只有4艘船,170人,和九十年前郑和的船队相比简直是小巫见大巫。是什么导致了中国的落后?就是闭关锁国的政策,烧毁了所有的船只,毁掉了所有的航海记录,严禁人民出海。这说明什么?不是我们中华民族没有西方人聪明,不是技不如人,而是制度、政策限制了我们去发展技术。读书至此,真是令人扼腕叹息。


现在人类面临第四次工业革命。一般认为,第四次工业革命是生命科学、材料科学、信息科学等领域一系列新技术的整体,其中人工智能、大数据、云计算是重要的组成部分。中国人民大学国际关系学院副院长金灿荣说过,能否抓住第四次工业革命的机遇,决定了未来中国能否屹立于世界民族之林,能否实现中华民族的伟大复兴。这里我想引用国家网信办主任庄荣文去年年底发表的署名文章中的一段话:农业时代,土地是最重要的战略资源,国家、民族之间的战争几乎都围绕着争夺土地展开。工业时代,以煤炭、石油为代表的能源矿产成为最重要的战略资源,能源控制权往往成为国家争夺的焦点。进入信息时代,随着信息技术和人类生产生活交汇融合,互联网快速普及,全球数据呈现爆发增长、海量集聚的特点,数据日益成为重要战略资源和新生产要素,对经济发展、国家治理、社会管理、人民生活都产生重大影响,数据掌控能力日益成为衡量国家竞争力的关键因素这是国家高层官员具有代表性的论点。所以一定要站在一个更高的角度来理解数据作为生产要素的重要性,抓紧发展大数据产业。


(三)重点是抓好落实。中央文件高屋建瓴,但能不能执行好,重点是抓落实,在这方面政府和企业都有责任。《意见》中关于数据要素的部分有三段话,但不能只看这三段话,前面的指导思想、基本原则,后面的市场化改革、组织保障,都适用于数据领域。作为一个大数据企业的从业人员,我特别关注三点:(1)推进政府数据开放共享。李克强总理在2016年贵阳大数据博览会开幕致辞中曾经说过,中国80%的数据掌握在政府手里,鼓励政府机构打破垄断、开放数据。中国信通院的一位专家也说过,中国现在政府数据开放共享不尽如人意,原因是“三不”:不敢、不愿、不会。不敢,就是怕出事。不愿,就是觉得数据可以带来这么大的利益,我为什么要分享给别人?不会,就是过去还没有建立起来数据分享的这种专业技能。推进政府数据开放共享任重道远。(2)重点建立交易平台。数据只有流通起来才有价值,如果仅存储在机房里、硬盘深处,便无法充分发挥价值。数据流通最好是有公开市场、明码标价,防止出现黑市,所以交易平台的建立非常重要。为什么会有数据交易黑市?其中一个重要原因是没有正常的交易市场,所以就转入地下。中国的数据灰黑产的市场规模保守估计有800亿到1000亿。(3)对不同市场主体一视同仁。《意见》指导思想里有一句话, “保障不同市场主体平等获得生产要素”。我们励讯集团作为长期扎根中国的外资大数据企业,对这句话非常认同,坚决拥护,希望我们作为一个市场主体能够平等获得数据。


02. 您认为《意见》的出台对中国的大数据行业会有怎样的影响?对中国大数据行业的发展趋势您是如何判断的?


张玉国一定会对中国大数据行业有非常积极的影响。中国大数据产业的春天就要来了,但现在还处于“乍暖还寒”的时期。中国大数据行业一定会发展成为全球最大市场。理由有三:(1)中国拥有巨大的人口规模和市场规模。数据的根本来源是人类的活动,中国的人口规模和市场规模都是别的国家无法比拟的。据《第45次中国互联网络发展统计报告》,截止2020年3月,中国网民数量达到9.04亿,网络购物用户规模7.1亿,2019年全国网络零售额10.63万亿元,连续7年世界第一。这都将产生海量的数据。(2)5G、人工智能、云计算、大数据这些新技术在中国方兴未艾,某些领域局部领先。以5G为例,中国企业声明的5G专利世界领先,华为、中兴的5G标准必要专利分别占世界第一和第三位。所有这些技术底层涌动的都是数据。为什么大数据会在今天发展起来?因为过去技术不成熟,现在技术逐渐成熟,可以捕捉利用这些数据了。(3)国家层面的顶层设计和执行力。这是中国的独特优势。我特别关注一位日裔美籍政治学学者福山,这几年他有一个新的观点。他认为一个良制社会离不开三个要素,一是国家能力,二是法治,三是民主问责。中国的国家能力超强,通过这次疫情的应对也可以看出来。一天之内能把1100万人口的城市封锁起来,十天就能建好一座临时医院。这种超强的国家能力落实到顶层设计和执行力上,是中国大数据行业得天独厚的优势。这是乐观的方面。


但是我们也不能盲目乐观,《意见》出台以后,我看了很多专家学者的采访。他们都表示,中国大数据行业还有很长一段路要走。我刚才说过这是“乍暖还寒时候”,我们要努力做的,就是让“乍暖还寒”早点过去,让春天早点到来。我认为取决于三个因素:一是解放思想。从文件的出台看,上层已经解放了思想,现在关键是要要中层和下层解放思想。刚才我提到很多机构、部门、地区存在数据共享开放的“三不”(不敢、不愿、不会),要破除“三不”,就要解放思想。要站在更高的角度理解数据作为生产要素的重要性,要“敢为天下先”。二是中央层面要有机构来推动。现在我们感受到的是,中央层面管数据安全和隐私保护的机构措施很多,但是管发展的相对较少。比如说很多专家学者都提到,如果没有中央层面的有力推动,跨省之间的数据共享都很难形成。据《财经》报道,贵阳大数据交易所从2015年4月成立以来,到2019年5月,累计交易额才4亿元,多位受访专家表示,这样的成果没有达到各界预期。所以中央层面要有机构来推动,打破数据孤岛,形成真正的数据交易市场。三是在数据安全和发展中找到平衡。大数据产业发展离不开数据安全。在法律层面,中国已经基本构建了基于《网络安全法》的大数据安全法律法规及标准框架。《网络安全法》2017年颁布以来,百余个政策标准在发布生效或制定中。在执法层面上,这几年力度很大,2018和2019被称为数据安全和隐私保护的“执法年”。但是大家是否注意到:中国目前的态势是一个健康的数据交易市场还没有完全形成,而我们的执法力度非常强,有一点不平衡,造成一些人“谈数色变”。我们坚决支持严格执法,但这种失衡长期持续下去,不利于大数据产业的发展和创新,一定要找到一个平衡点。


最后我认为,中国大数据产业发展比较成熟的一个标志,就是出现若干“中国的励讯集团”(也许这样说有点不太谦虚),或者说是中国有国际竞争力的大数据专业企业。励讯集团做大数据已经50年了,在Big Data这个词热起来之前,我们就靠它吃饭。如果看励讯集团的历史,可以追溯到400年前,也就是说400年来,我们一直在做内容、做数据,我们对数据有很深的理解。励讯集团成功原因不外有三:一是有能力通过各种渠道汇聚海量数据。二是有先进的大数据处理技术HPCC。三是了解用户需求,解决用户痛点问题。


励讯集团旗下大数据风险分析版块几年前刚刚进入中国市场,遇到比较大的困难,就是数据获取。我打个比方,就好像米其林三星大厨来到中国开餐馆,但是找不到食材。我们愿意与本土企业合作,把我们多年来做大数据产业的心得分享出来,形成双赢局面。我觉得中国大数据产业最终要实现健康发展,其标志就是有具有国际竞争力的大数据专业企业出现。

3.jpg


03. 您如何看待中国的政府数据开放进程?中国的政府数据开放和欧美相比有什么特点?


张玉国上文已经谈了一些看法。我认为中国政府数据开放成绩很大,但也有很多不足。不完美,如果完美就不需要出文件了。很多专家学者都指出了这一点。刚才我提到,中国80%的数据控制在政府手里。中央党校王静教授认为,政府数据共享是一切的源头,“没有政府数据共享,数据开放、商业数据和政府数据的融通与利用都无从谈起。这次的《意见》让大家看到了中央更坚定的信心,但究竟能否有实质改变,还有待观察”。华东政法大学高富平教授认为,政府数据开放是一个大前提,“有了这些数据,市场才有足够的米下锅”(《财经E法》2020.4.11)。


几个建议:第一是要给政府一些时间中国的政府信息公开条例是2007年颁布的,美国是1966年颁布,中间相差40年,所以我们还是刚刚起步,要给政府一点时间去调整。第二是借鉴其它国家和地区的经验比如励讯集团在美国市场可以从25000多个数据源公开获取数据,其中很多是政府和公共机构的数据,包括财产类、信用类、证照类(各种教育证明、打猎证、持枪证等等)。其中最典型的是与交通管理有关的数据,在美国各州交管部门都是独立的,50个州的交管数据可以公开买卖。谁说政府拥有的数据不能公开买卖?这么做,有利于形成一个公开透明、暴露在阳光下的市场,也形成一定的门槛,守规则、有能力的企业可以进来利用这些数据。如果是免费的,不管有没有能力、资质,都能摸到数据,那就乱了。谁说公益的事情就不能收费?自来水、公共汽车、高速公路都有公益性质,哪一个是免费的?数据交易的收入还可以进入国库,做公益事业。跟欧美相比我们国家起步较晚,应该奋起直追。第三是促进建立开放的行业数据共享平台。励讯集团在欧美市场的一个重要经验就是建立行业共享平台,我们在美国市场运作建立了14个行业共享数据库,这对大数据产业的发展至关重要。当然,中国是一个比较自上而下的社会,有时候单独靠企业的力量,很难建立起行业数据共享平台,这就需要政府和政府支持的行业协会出面组织。行业平台一旦建立,就要落实中央文件要求,对所有市场主体开放。

4.jpg


04. 欧洲政府对数据运用的监管是极为严苛的,美国相对宽松,中国的数据政策正在建立过程中,您能具体讲讲国外与国内对数据监管的差异以及您对中国数据政策取向的看法吗?


张玉国:我比较赞同上海交大何渊教授的一个概括:欧盟是“数据基本权利”为基础的模式,集中体现在GDPR,即《通用数据保护条例》。美国是“自由市场+强监管”模式,集中体现在CCPA,即《加州消费者隐私法案》。中国应该在数据安全、隐私保护和数字经济发展之间取得平衡。


我们先看一下欧洲。GDPR被称为史上最严数据安全法,主要体现在两方面:一是把数据权力作为人与生俱来的基本权利,和其他人权是一样的,这就提到了很高的层面。二是处罚措施非常严厉,罚款1000万欧元起步,上至企业年度销售额的2%。欧洲GDPR如此严格有很深的历史原因,二战期间,希特勒纳粹政府迫害犹太人,通过各种渠道得知犹太人身份之后进行迫害,这在欧洲人心中刻下了很深的伤痕。我很尊重把数据权作为人的基本权利的看法,但是从另外一个角度我想提一个问题,数据的安全和隐私保护是基本人权,那么人类获得经济发展和生活幸福、以较低的价格享受创新的产品和服务是不是也是一种重要的人权呢?支付宝和微信本质上都是大数据产品,现在我说我要剥夺你使用这些产品的权利,是不是对人的权利的一种侵害?据Market Watch 2018年统计,全球前20的互联网公司, 11家来自美国,9家来自中国,没有一家是欧洲的。很多专家学者都认为这和欧洲的数据保护政策有一定关系。大家也许已经看到了,最近欧洲颁布了新的数据战略,我认为是欧洲也认识到了这一点,他们也在调整,在寻求平衡。


美国在联邦层面没有统一的立法,也没有统一的联邦监管和执法机构,其规定和监管主要在联邦贸易委员会(FTC)、联邦通信委员会(FCC)、证券交易委员会(SEC)、消费者金融保护局(CFPB)等机构之中。其中FTC的权力比较重。这种“自由市场+强监管”的模式,总体感觉是入行门槛比较低,但违法成本很高,甚至有可能倾家荡产。4月25日我们看到报道,Facebook和FTC的和解协议得到联邦法院的批准,数额高达50亿美元,创下了历史纪录。其缘起是Facebook被指利用调查工具向英国的一家公司“剑桥分析”(该公司已经破产)不当分享了8700万全球用户的信息。2019年著名征信公司Equifax因数据泄露,最后被罚款5.25亿美元,高管离职。在“自由市场+强监管”的体系中,如果是good corporate citizen(好的企业公民),就可以相对自由地利用大数据为社会创造价值,但bad player(市场破坏者)就生存不下去。在这里大家要排除一个误解,以为弱监管、不监管就会诞生更好的大数据产业,我没有这个意思。上海交大何渊老师也说过,如果按照这个逻辑,世界上最好的互联网公司应该出现在非洲、中东地区。只要安全保护和发展能达成平衡,大数据产业就能为人类造福。


刚才我提到破除“三不”,其实最难的就是“不敢”——怕出事。在这一点上,我们都要学习邓小平。大家还记得,在改革开放初期,安徽有一个卖“傻子瓜子”的个体户叫年广久,他靠卖瓜子起家,赚了很多钱。主管部门认为这个人走资本主义道路,想把他抓起来。但是小平最后说:“不要动他,你解决了一个傻子瓜子,会牵动人心不安,没有益处,让‘傻子瓜子’经营一段,怕什么?伤害了社会主义吗?”在那个还在争论“姓资姓社”的问题的年代,小平就能有这样的大气魄。我认为要有这样的精神去突破“不敢”。


中国大数据行业发展,对中国的政策制定者和法律专业人士也提出了很高的要求。中国的互联网行业(尤其在某些领域)世界领先,为什么数据安全和隐私保护的法律法规要照抄照搬国外的呢?有一种观点认为,中国目前的数据安全和隐私保护,基本上都来自于GDPR。我觉得在大数据立法领域,中国应该实现从学习者、遵循者到制定者、参与者的转变,要从跟跑、并跑到领跑。如果我的孩子在高中阶段开始考虑选大学专业,学理工科的,我一定建议她学跟数据科学相关的专业,如果学法律的,一定建议她学跟数据相关的法律专业,将来一定大有前途。


05. 数据开放的过程不免会遇到挑战,其中最显著的就是如何规避数据的滥用和不合规使用的问题,2019年也出现了大批数据执法案例,您认为数据开放过程中的这些挑战该如何应对?


张玉国:我认为这不是数据行业特有的情况,每个新兴行业在发展初期都会面临这种情况,都要经历从“乱”到“治”的过程,但一定会有治理好的那一天。具体怎么办呢?我上面也谈到了,要靠“自由市场+强监管”:第一是靠市场调节。数据是一个生产要素,最终要受市场规律的支配,这方面的资源配置要靠市场。《意见》里都有明确要求。第二是法律法规要明晰。今年个人信息保护法,数据安全法都会陆续出台,包括2017年的《网络安全法》,法律的制订有助于数据领域规则的明晰。第三是执法要严格。让好人能够充分利用数据,让坏人无处藏身。但同时要避免“九龙治水”(多个部门重复交叉管理),一阵风式的“政绩式执法”。我在上面也谈到,我坚决支持严格执法,但在国家层面,从长远角度综合考虑大数据产业的健康发展,还要考虑执法所传递的信息,要以执法来促发展,而不是遏制发展。


06. 在数据开放的过程中,很多数据拥有者对将数据提供给第三方数据产品提供商颇有顾虑,都希望直接与数据使用方(例如银行、保险公司)合作,一方面认为减少中间环节数据安全更有保障,另一方面认为第三方供应商的数据安全和保护能力良莠不齐,您如何看待这种情况?


张玉国:我觉得这是对市场经济和大数据行业比较肤浅的理解。最基本的经济学知识告诉我们,分工是市场经济的一个基本特点,几乎没有不存在第三方的产业。打个比方,农民养猪种菜种小麦,面粉公司、屠宰场、超市是制作食品的第三方,而我们都是食品的最终消费者。现在农民因为担心食品安全,不希望通过面粉公司、屠宰场、超市这样的第三方,想把猪和小麦直接卖给消费者,让消费者自己杀猪、磨面粉,这显然是不可行的。现代产业分工一定会有第三方,甚至第四方、第五方出现,越来越细化。


回到我们这个行业,银行、保险公司对大数据风控产品需求比较强烈,但这并不代表他们一定要具备大数据处理分析能力,它们也不需要具备。它们需要的是做好金融服务的本职工作,把大数据分析这样的工作交给专业数据公司来做。如果按照上面这个逻辑去推理的话,连银行都不需要存在,因为它也是一个第三方,我们直接把钱借给企业就行了。这可行吗?还有,银行、保险公司的数据安全保护能力不一定比第三方强,金融机构当然也要做好数据安全,要提升这方面的能力,但第三方大数据公司专门是靠这个吃饭,像励讯集团,如果我们不做好数据安全和隐私保护,饭碗就砸了,所以一定会按照最高的标准做数据安全和隐私保护。集团旗下的保险业务在中国的公司精励联讯,是一个处于发展初期的只有100人的小公司,但首先做的一件事就是确保数据安全,2017年3月通过了ISO27001信息安全体系认证,今年初又通过了“信息系统安全等级保护2.0标准”三级认证。

5.png

为什么会出现这种简单的逻辑错误?在别的产业习以为常的第三方机构,在大数据行业反而不敢用?归根结底还是大环境让大家“不敢”,“咋暖还寒”之中,整体氛围还比较“冷”,加之高调的执法案例,更让人感到寒意。这与中央的要求、与大数据行业长期健康发展是不符的。