众安保险-王禹:数据魔方赋能新车险

2018-06-25 15:17
作者:分子实验室
来源:分子实验室

王禹:

大家上午好,刘扬一个月之前给我打电话说他们在乌镇要开一个会让我在这做分享,他请的嘉宾都是重量级的嘉宾,都是科技的大咖都是前辈,我作为一两年的菜鸟确实跟大家谈不上介绍,众安在传统的保险公司眼里这几年也是一个另类的存在,我相信刘扬总也是听到了这么多的呼声,想听听众安到底是怎么回事儿,到底在做什么,还是想了解一下这方面的情况,我说好吧,我确实是一个科技的小白,而且确实身上没有太多科技的基因,所以我说我只能把我讲的明白的这部分给大家做一个简单的分享,尤其是车险领域。

首先我先简单介绍一下众安,众安这几年做了一些实实在在的工作,尤其是在科技的领域,我们去年的研发费用投入占到了我们总保费的8.7%,这在任何一家保险公司是不可承受的,我们2500多名员工里面有1385多名是来自于科技领域的专家,包括区块链、人工智能、大数据等等。就拿我们车险这块来讲,我们有40多位来自于大数据、车联网等领域的专项人才,对我们车险保费来讲是没有短期的现实的应用,但我们是在这些基础层面、应用层面的研发和投入,我们注重的是五年以后或者三年以后的未来。

众安现在有五个生态系统,消费金融、生活消费、航旅、汽车、健康,我们在生态系统里沉淀了保险科技技术,计划向外输出,成立了众安科技,专门用于做科技的研发尤其是底层的研发,我们现在众安科技有800人的科技平台;后续为了向海外输出我们的金融科技技术,我们又新成立了子公司——众安国际。

接下来跟大家分享的是我们众安汽车,即车险这个板块在大数据应用上的一些探索。我看到那么多的科技,包括区块链、人工智能、大数据,我认为大数据应该对保险来讲是落地见效最快最直接的一个板块,我们这几年尤其是在车险领域利用大数据做了一些实实在在并且有成效的探索,在这里我跟大家做一个分享,我们有一个逻辑,第一就是我们底层建立了一个大数据的生态,这里面包括了我们各个合作伙伴的数据源,我们建立了一个产品叫数据魔方,第二个就是数据魔方直接作用于我们的赋能。

我们大数据的生态有一部分是来自众安科技的技术,人脸识别、OCR等等,作为底层技术,底层以外有大数据的应用,包括客户画像、大数据定价产品创新等,这最底层的还是一个数据源的问题,待会我还详细介绍数据源来自于我们的大数据联盟,包括我们构建大数据生态过程中连接的很多的生态伙伴他们所积累的数据源。首先讲一下大数据生态,有一个架构的创新,我们在车险这个板块里面有一个大数据应用专门的部分,叫大数据实验室,有20多个员工,他们来自于我们的产品精算经理,我们有5位行业里面比较顶级的工程师来支撑我们的大数据技术,这里面还有人工智能的工程师,我们有十二三个人,这块我跟他们说是不设限的,有这方面的人才我们绝对是欢迎的。他们有一个特点,就是很贵,并且短时间内可能不会做什么东西,但是做出来一定会让你大吃一惊,所以我们要给他们让他们去做。

有这个支撑我们就做了四大能力板块,包括大数据能力,平台支撑能力,标签支持能力,数据采集能力。

第一个,我们的大数据赋能能力,这是应用层面的创新。

第二个,我们平台的支撑能力,我们有两个平台,第一个就是离线的平台,第二个是实时评分的平台,他对于生产的实践非常契合,相当于核保人的一个环节,过来一个前端,过来一个数据,实时的评分,这个是对于支持线上快速、自动核保非常有价值的。

第三个就是我们的标签支持能力,最后一个就是我们的数据采集能力,我们的数据来源其实一方面包括我们的保险数据,首先众安就是一个巨大的保险数据的来源,单单2017年的年度累计用户是4.32亿,不谦虚的说我们可能是全中国拥有保单量最高的公司,可能有些保单保费也就2到3块钱,但是这个保单带给我们的不仅是保单,还有他背后的数据,第二个就是我们的互联网数据,包括我们的股东我们的合作伙伴提供一些基于互联网行为的一些数据。第三个就是驾驶行为数据、征信数据等等,驾驶行为数据我待会儿还会给大家做分享,总之对车险的定价还有以车险相关数据的应用,驾驶行为数据应该说非常的关键。

所以讲了刚才的能力,应用层面主要有几个方面的应用,第一个就是定价和沟通的体系,我们云集了这么多的数据,我们积累了这么多的人才,我们练就了这么好的能力,最主要的目的就是赋能我们的生产环境,能够使我们的生产流程包括我们的核心能力,包括风控、包括风险的选择、包括我们的精准营销等等这些方面,能够更有效率,能够比别人在这方面更高一层。

首先讲到我们的定价,我们做了一个定价模型,跟传统的基于大数据做了一个定价模型,传统保险公司的专家都了解,我们传统的保险公司做定价,唯一的数据源就是来自于我们的承保数据源,而且我们做定价一直以来的方式就是我们的精算GLM广义线性模型回归的方式,我们行业为什么说行业同质性,其实我觉得跟这方面也有相关性,就是我们选用的模型是一样的,我们数据的来源基本上也是差不多,只不过A公司和B公司在理赔质量管控上有区别,所以他的理赔数据跟别的公司就不一样,仅此而已。

但是我们做的大数据的定价就是引用了除了承保里面引用的,更多是信用险的数据,比如说我们整个信用客户的信用数据,比如说互联网的数据,用了这个数据以后,你再用传统的GLM模型建模是不可行的,所以我们引入了机器学习的方法进行建模,他可以不断的进行输出模型结果,他的迭代速度肯定不是人可以比拟的,我们有大量的数据不断迭代出来的结果,从结果看大大超过了我们的预期。在车损险行业的平均值大概是6.5到7.5,我们做1.0版本的时候已经提高到8.9倍,三者险的区分度我们把3.5提高到了4.2,可能搞精算的人懂一些,这种区分度的提升其实代表了定价精准度的提升,但是有一个缺点,我很难解释,因为我用的是机器学习算法建模,所以我很难说风险大小背后的原因是什么,比如说我们发现三大运营商里面使用不同运营商的手机号码的用户他们的车险的风险是不一样的,你说具体原因是什么我也不知道。还有像退货险,退货几率比较高的用户比平均的用户提升了10%,这背后的逻辑是什么?我也不太清楚,所以这就是机器学习算法能带给我们的,一方面是带来了极大的效率的提升,另外一方面也给我们核保人有一定的挑战。

第二个我们做了精准的客户心理画像,待会我还会给大家举一些具体的例子,给大家做一个展示,第三个就是我们数据驱动的保险产品和服务的创新,我们开始基于客户画像我们开始转变传统保险公司,用户想到的时候会打个电话给保险公司,这种的交互效果很不好,我们尽量通过客户的画像我知道他在哪个场景,然后在这个场景的时候我们主动推送给客户这种产品,这样接受度就很好。

然后我们基于数据做车联网建立战略网,我们想未来车险的变革一定是朝着车联网的方向,是一个很确切的趋势,所以提前利用数据和技术能力在这方面做了一些布局。

第五个就是通过我们的人工智能搭建,实现我们的科技赋能,比如说我们车险的客服,过去我们保费每个月只有700万的时候,我们的车险客服也就三四十人,我们现在保费发展到每一个月两三个亿的时候我们车险客服还是只有五六十个人,我们至今为止还没有发生一起客户到12378投诉的,证明我们的客服还可以。

第六个就是我们联盟的伙伴,技术的人才,因为我觉得我们是一家小公司,没有像BAT这样的体量,而且是成长的公司,我觉得开创是一个最好的赋能成长的一个价值观,所以从一开始的时候我就想,用开创的心态来吸纳我们所有联盟的合作伙伴,来共同创造一个很好的数据生态。

接下来我会讲一下大数据联盟,我们大数据联盟从2017年9月份开始,我们集合了包括众诚保险、华安保险等等,我们组成了大数据联盟,因为我们在定价上都有需求,一方面数据量不够,一方面定价能力不足,所以我们集合抱团取暖的方式组建了这么一个大数据联盟。

后来组建的过程中我们发现,一方面保险公司非常认可,因为现在他们用的就是我们的定价模型,我给他一个定价模型以后,他的精算部过去要招3、4个人,现在只需要留一个人就可以了,只要懂得这个怎么用就可以了。

后来越来越多的保险公司加入了我们的大数据联盟,但是我们觉得我们做的是一个大数据的联盟,我们就不能把联盟仅仅局限于我们的保险公司这么一个小的范围内,因为我们所有保险公司来的数据都是同质的,后来我们就引入了像车联网的企业等等在行业上车联网做的风声水起的企业,他们有精准的客户画像,定价这样的需求,所以又走到一起,加入车联网的合作伙伴。

后来我们加入了像百融这种征信的平台,他做互联网征信,背后他有非常完整的关于信用的评分体系,现在很多的银行都是用的他这种征信,而且我们还有跟他们的合作关系,所以我们把互联网征信的数据也加入了进来。

再后来可能跟一些互联网平台的合作伙伴,一些互联网行为的数据,看起来跟我们的平台车险没有什么关系,但是我们把这些数据放在一起,超过预期的发现他们之间还是存在着一些非常神秘的耦合,具体的原因可能无法解释,但是结果可以证明这一点,所以我们的大数据联盟越来越壮大,现在我们大概纯粹车险的数据就有1500万条,可能还有其他的像信用评分的数据跟我们的数据大概可以匹配到70%,价值行为数据大概跟我们的数据可以匹配到10%,其实已经很厉害了,我们再集合这几方面的数据再做我们的大数据定价,再做我们的精准营销。

我们的大数据联盟是开放的,每一家公司过来都是平等的,我们在阿里上建立了一个阿里云?,就像独立的一个机房,所有联盟的成员都是共享的,只有所有的联盟成员,所有的数据是只进不出的,所有的联盟成员同意我们才可以进入我们的数据库,安全也得到充分的保障,所以最后我们经过一期和二期的磨合,应该说大数据联盟目前的运行还是非常好的,其实一部分承担跟过去可能中保信想做的东西,因为他没有商业的动机,按理来说他做这个是最有价值的,最有优势的,但是他没有那么强的动力,但是对于我们来说我们有迫切的需求,把我们的定价,把我们的客户分析做的符合我们,能够为我们的生产带来实实在在的效果,正是这种实实在在商业的动机促成我们走在一起,建立这种大数据的联盟,未来我们可能会如果有些专利可能会共同的去领专利,下一步我们会快速地复制和推广这种模式,未来有一些需要这方面,包括定价包括客户画像等等,这种需求的其他的伙伴们,可能就需要付费加入,我们所有的联盟成员就可以分享联盟的成果。

最后一点就是我们现在正在推动用我们的区块链的联盟链来打通我们合作伙伴的数据,这样一方面你们的数据就不用再上传了,第二是由于区块链分布式的特点,不可篡改,这个情况下我们也可以建模,这样为我们的联盟的可拓展性提供了非常好的工具,所以我相信我们的联盟会越来越强大。这就是我刚才讲的通过我们的区块链连接我们联盟成员的数据库,使他们可以放心的在我们这个体系内建模,放心使用数据。

第二块讲一下我们有了数据魔方的产品,我们有了产品以后产品的目的还是为了赋能,可以适用于我们的生产场景,使我们的生产可以更优化,成本更低效率更高。

我简单介绍几个小应用,但是确实对我们产生了实实在在的价值,比如说我们投保流程的优化,各位可能感受一下,众安汽车车险的投保流程跟所有车险相比我们做过一个测评,我们是最好的,我们是数据魔方的赋能,我们把所有的投保流程设计了全流程的埋点,我们不断根据埋点的每周分析,进行持续的线上投保流程系统迭代,我们对埋点数据进行分析,客户在某一个节点如果停留的时间过长,我们就认为这个节点是有问题的,我马上针对这个节点进行改进,所以从去年6月份开始到现在我们已经迭代了二三十个版本,现在是慢了,但是我们看到了效果,上线10个月以后我们投保的转化率提升了1.6%,虽说是一个小小的改变,却带来了实实在在的效果,这就是我们所追求的,我心目中所追求的科技赋能保险的一种方式。

第二个就是我们的精准营销,大家知道过去我们的痛点就是投保查询比很高,大量的客户在我们的销售渠道里面,他报价很多,可能100次报价或者150次报价都无法有效的转化,但是这个报价是一个很重要的途径,就是通过报价我们知道这个客户有购买车险的意愿,所以后来我们用数据化的工具把所有报价的用户拿出来做一个建模做了一个分析,然后我们把这些用户划分成10个等级,我们发现转化率最高的那个等级的用户和转化率最低的那个等级的用户他们之间的转化率差18倍,所以我们就只追前三个等级的用户,对后面七类的用户我就不追了,所以我们就保证我们现在五六十个人也够用了。

第三个就是我们的海德薇保单配送系统,怎么样使我们的保单配送像传统把网点遍布各个公司一样,可以达到这种配送效果和体验,这对我们是一个很大的挑战,刚开始客户的咨询很多都来自保单的配送,所以我们用了人工智能加智能的方法来解决我们的保险配送,所以我们研发了一个保单的配送系统,根据他的时间节点和问题用人工智能方法进行了优化,最后我们开发了一个配送系统,有了这个配送系统以后我们的配送费用,过去是50块钱,我们现在又计算了一下降到了18块,因为每天都在计算几千份保单,由此所带来的节省,我们500份保单的话可能就是十几万的成本,这对我们也是一个实实在在的提升,同时我们的配送效率也提升了20%,客户拿到这个保单的时间更及时。

第四个方面就是我刚才讲到的我们通过用户的画像,过去我们都是人找服务,后来我们通过用户的画像去服务找人,比如说我们的用户到了机场,而且他是有车的用户,那我们会推送给他机场附近的预约停车服务;还有比如说违章查询,过去都是主动查询,现在只要加入我们的用户体系,我们会随时提醒用户,而且打通了一个违章跟线上违章罚金缴纳的过程,可以在线上完成这种支付,这样会让用户实实在在体会到我们保险公司带给他的服务和价值,他服务的体验更好。

我在这里给大家举的四个例子都很简单,可能在座的科技大咖看起来都非常简单的应用,但就是这种很简单的微创应用确实在改变我们的行业,降低我们的成本,客户的体验更好。

刚才讲我们的定价能力,可能在前面那章已经跟大家做了一个分享,就是我们怎么样做定价,总体上来讲我们还是突破了传统的精算定价的这种约束,我们开始引用大数据学习的方法我们进行车险的定价。车险定价很多传统的东西已经做的非常好了,但是有没有一种可能性就是我们引入更多维度的数据,我们可以把这个定价搞的更清楚,并且了解承保的对象在哪里。

优质业务不一定是指不出险业务,而是精准定价的业务,例如二手车风险很高,但是二手车里面有没有风险很低的,或者说甚至可能低于我们传统旧车的车型呢?或者这些用户呢?后来我们通过定价模型发现是有的,但是我们保险公司在核保的过程中会把二手车一律打长标签,要么不保,要么很低的保,对真正低风险的二手车是不公平的,但是最主要的能力就是你要具有沙子里淘金的能力,我在更好的用户里面我无法做的更好,但是我在比较差的用户里面我们可以找到好的,这就是我们价值所在。

我们从传统定价系统里面的维度包括渠道的因子,自主定价、自主系数等等,到了一个包括我们气候的影响,公里数,行使区域,开车的习惯、车辆的健康指数等等这是加入我们的一个UBI的驾驶使用。

还有一个例子,在我们的领域我们会根据一个逻辑就是把不同的客户进行分层,不同的客户包括风险的高低包括未来的潜在的价值,包括跟我互动的黏性,包括他现在可以交叉销售的一些可能性、潜能,我划分为不同的,做成一个产品是老司机指数,然后我们根据这个指数我们做不同的等级,根据不同的等级我们做不同的智能化推荐。有一些老司机指数比较低的用户,他一年就上来一次,你再怎么互动对他都没有价值,你一方面耗了大量的人力物力还达不到效果,我们就放弃,所以我们就是根据老司机这样的产品做了一个划分,跟我们用户的互动明确效果有效的提高了,比如说我们的用户跃活数在上升。

这就是我刚才讲的一个从数据出发怎样应用于我们车险业务和生产的实践做了的一个小小的分享,很多我刚才讲过的,在各位大咖看起来都很简单,但是对于我们来讲只要有用的就是好的,谢谢大家。