您现在的位置是:贵州快3 > 广东11选5 >

大数据征信之痛如何让数据更好的流动共享

本站2019-05-29 08:35人围观
Tag:

大数据征信之痛如何让数据更好的流动共享

  上海凭安征信服务有限公司,是在工信部的指导下,经中国人民银行总行备案设立的信用评估及信用管理机构,长期致力于可信互联网业务创新,运用大数据及云计算技术客观呈现企业和个人的信用状况,已经成为国内领先的互联网金融领域反欺诈服务和风险控制供应商。

  二、单独的数据维度在很多情况下是不够精准的,这在征信行业特别明显。而多维的数据的交叉就能精准地刻画一个人或一个企业,每增加一个维度,数据的价值不是加法,应该说是乘法,甚至是指数级别的增长。

  我们通常说的信用信息,在金融中是有特指的,主要包括偿还能力和偿还意愿。与我们经常看到的,像过马路闯红灯、坐地铁逃票,以及平时爱买什么样的东西等记录还是有差别的。也可以说是应用的场景不一样,就需要不同的信用信息。

  在当前,互联网金融还没有进入人民银行的征信体系,所以整个信息是无法互通的,同时互联网金融的用户和银行的用户重合度很小,也就是说能在银行贷款的用户,也不会到P2P贷款,这两类机构的风控水平也明显的将两类用户区分开来了。

  那么,什么是有数据呢?每个金融机构都有一个人体在本业务体系的完整征信记录,也就是说,每个金融机构都非常有数据,但是这些数据都是作为数据资产是严禁流转的,所以就产生了既缺数据,又有数据的矛盾。

  这种矛盾在整个大数据行业也是比较明显的,所以大数据产业一个比较怪的现象,大家都喊着数据要共享要交叉,但是谁也不愿意把数据拿出来,包括现在各地的大数据交易中心纷纷成立,目标是解决数据共享流动问题,也没有很好的解决这个问题。

  这种方式是第三方大数据公司用各自的能力和方式主动采集数据,对数据进行加工整理后,向各个应用机构提供数据服务。

  这种模式的核心是征信中心和大数据公司的采集能力,只要有能力有途径就可以采集,甚至不管被采集的机构愿不愿意。数据的获益者是大数据中心和征信机构,而数据的生产者却没有得到明显的好处,所以现在的很多数据机构都很头疼,想法设法让自己的数据不被第三方机构采集。

  由于采集数据具有外部性,最大的问题就是信息的完整性和及时性很难保证,所以现在很多的互联网金融机构,会同时接多家征信机构来补充完善数据,还是无法解决问题。(征信机构之间同质化相对比较验证)

  这种方式是行业数据中心要求各个业务机构把数据上报,然后数据中心会把这些数据进行加工整理,再向现有的业务机构提供服务。

  这种模式与第一种模式不同点是:第一种是主动采集,这种是要求机构上报,在数据上也是有差别的,上报的数据会比较纯粹、比较单一。

  这种模式是一种强中心模式,很多机构是不情愿的,所以这模式很通常只能靠行政手段来执行。典型的像工商的企业数据中心、人民银行的征信中心,只有这种强势的部门才能建立起来,这种模式是没有办法进行数据最大化共享和价值最大化发掘的。

  这种模式是比较常见的,也是相对比较市场化的模式。在这种模式下,各个机构不需要再把数据事先交到数据中心,而是保留自己的数据库,通过API与数据中心连接。

  当一个机构需要数据时,会把请求发到数据聚合中心,数据聚合中心会将这个请求发到除这个请求机构外的所有机构。机构收到请求后,有数据的机构会返回数据,数据聚合中心将返回的数据加工整理后再给查询机构。

  这种方式比前两种方式都进步许多,数据由数据提供者自己保存、自己控制;并且,数据的收益权也归了数据所有者。这也是当前很多数据联盟采用的方式,包括现在的互联网金融协会的数据共享模式以及很多的大数据交易中心都采用了这种模式。

  但是这种模式存在三个比较严重的问题。第一,查询信息的泄露,当一个机构需要数据,他的查询请求会被分发到其他机构,而在征信的场景下,查询信息本身就是一个隐私信息。

  简单举一个例子,有一个用户到我这贷款,我希望查询他在其他机构的表现,一旦我把这个数据查询请求发出,相当于这个客户的信息被所有机构获知,那么其他机构就有可能抢先联系我的客户,相当于我的客户在查询的时候被泄露了。

  第二,机构很容易投机获利。接入这个聚合平台后,机构最好的策略是接受请求,不应答,既能接收有意义的查询,又不泄露自己数据,并且还不违规。

  第三,表面上看,所有的数据都由各自的机构自己保存管理,而实际上一旦数据进行了流转,数据中心可以保留所有的数据,也就是说,最后所有的数据都会在聚合中心留存。

  简单总结一下前面几种模式,我们认为,当前数据流转不畅的一个重大原因是,数据中心或数据中介成为了最大威胁和最大障碍。我们知道商品经济时代,商品的交易中介起到了重大作用,包括线下的大卖场像国美、苏宁,以及线上的天猫、淘宝、京东,都汇集了众多的商品提供商和消费者,促成商品在他们之间进行流动。

  为什么在数据时代,这种数据中介反而成为了阻碍。因为数据有着它的特殊性:第一,数据具有复制的无差别性;第二,数据看过即拥有。

  以上介绍的数据交易/流通模式,作为中心能看到所有交易的数据,同时也就拥有了数据。中心一旦可以轻松得到数据,理论上,再有类似需求时,中心将不再需要原有数据提供者,可以自己直接提供服务。现在很多的中心会对外宣称,我们坚决不留数据,但是这只能依靠商业承诺,中心是有机会、有能力留存数据的,具体留没留,大家都不知道。

  5、数据只在查询方和提供方之间交互,任意第三方即使从网络中截取数据,也无法获取信息线、数据可追溯、可跟踪与可评估;

  、密码技术密码技术大家都不陌生,这里主要强调密码的正确使用。其中包含密码算法组合的正确使用以及流程的正确使用。

  只有加密算法的合理组合使用才能保证数据安全,比如要不可逆,必须要用到HASH,要不可抵赖不可篡改,要用到数字签名,需要数字的加密和解密的唯一,可能要用到数字信封。

  在系统的整个过程中,也必须要合理的使用密码技术。这里主要提三点,密文索引、密文查询和密文获取,涵盖了整个的数据获取流程,只有整个数据流程的合理使用,才能保证数据的保密性和不可抵赖性。

  我对这种技术的理解,它是分布式的、完整的、不可篡改的、多方参与和监督的记录方式。

  。我们之所以引入了区块链技术,主要是利用他的透明操作和公共监督,让中心变成随时可监督、可抛弃、可替换的服务者。

  开放与开源其实无论系统设计的多么完善,都挡不住实践中的“小技巧”(漏洞或后门)。理论体系再好,实现是黑盒,参与者还是不放心。

  ,所谓的协议开放是我把所有的数据格式、传输包都定义的清清楚楚,每一个参与者都可以自己实现加入系统;

  让没有能力做开发、做接入的机构,我们把实现的源代码开放给你,你自己来看,也就是让用户看的清清楚楚,来证明系统的清白。

  经过以上的技术开发,所有的机构加入了系统之后,首先向中心公布自己的索引列表,同时这个索引是一个加密索引,用到了HASH算法。所以说在系统里会形成一张加密过后的索引表,即使索引表被系统或任意第三方获取,他也没有办法反推出其中代表的明文。

  这个加密索引是用区块链来记录的,下载下来自己解析,系统也可以帮你解析。在应用的时候,只有当你真正遇到一个用户,比如某某要到你这里贷款,这时候获得这个用户的ID信息,把这个用户信息通过HASH算法得到一个密文,通过这个密文到加密索引里去查询。

  也就是说,在你没有得到用户的详细信息时,你是没有办法查询的。这样,通过对区块链或加密索引的下载来查询,就避免了查询信息泄露。通过查询索引我知道了某个机构有这个数据,这时候我可以单独发出请求,向这个机构获取数据。

  机构收到查询请求后,因为你提前公布了查询索引,所以你必须做出应答,这种方式也避免了做投机,只接受别人的请求。一旦真正的供需双方建立了连接,这时候通过事先约定的公私钥机制去做端对端的密钥协商,两端协商密钥,中心是无法获得的。

  然后双方用协商的新密钥去做数据加密和数据传输,这种情况下中心只看到了两端做数据交换,由于加密密钥中心无法获知,这时候就算数据中心想把数据做留存,也没有办法解密。

  、凭安有哪些不同的产品,以及它们相互之间关系?凭安征信的主要业务是做企业征信和个人征信。今天讲到的数据交换的模式是一种创新的业务,这个业务和征信是相反的,我们最初把这种模式叫作去征信机构化。

  基于这个理解,我们对我们的企业征信和个人征信重新进行了定位,金融机构之间的数据交易应该用公平交换的方式去做,因为这种数据最完整最纯粹也最及时,而大数据征信可以作为其他维度的补充,所以我们也建议大数据征信机构可以做自己非常独特的数据。

  我们现在的个人征信已经不再向金融机构宣称我们能获得所有机构的数据,因为我们知道这是获取不全的,而是在挖掘我们独特和特有的数据,我们最近会推出一个叫“染黑度”的产品,某一个人来贷款,你可以给我他的联系方式,我们会验证这个电话号码有没有被我们整理过的催收机构打过电话,也就是说他有没有被催收,从而获知他被黑的情况。

  、现在数据应该都是各个中心化为主的,要去中心化或弱中心化估计还有路要走,怎么样才能让数据拥有者有获利模式而主动选择对接数据呢?我们一直觉得数据的流通不畅,是因为数据的拥有者对数据不放心,数据具有复制的无差别性,一旦被复制没有任何差别,复制者可以卖一样的服务甚至价格更低,这是数据机构比较担心的,尤其对交易中心。所有我们设计了这样的模式,让中心拿不到有用的数据,这样数据的流转永远会通过你。而通过事先做索引和公布的方式也可以避免有些机构把数据买过去再重新销售,因为是可以在公开中被发现的,我们是希望通过这种方式让有数据的机构可以放心的把数据拿出来让数据增值。

  、以上商业上先不考虑,区块链确实在去中心化方面很有潜力,由于区块链会更新很多信息,我觉得区块链的膨胀是个问题,在数据爆炸时代可能会越来越大,会不会以后不可控制?我不赞成彻底的去中心化,难度太大,并且区块链也没有解决身份认证和存储问题,现货黄金赚钱技巧所以我们采用了区块链的思想,用区块链做透明的记录,让所有的参与者监督中心的操作,因为中心的操作效率是最高的。如果中心的所有操作是可控并在你的监督之下,去不去中心不是特别重要。

上一篇: 上一篇:关于燃料电池共享出行使用权交易不可错过的信

下一篇:下一篇:国债期货TF1403最后交易日大幅波动多空双方博弈