征信数据专家George:征信市场应开放分享数据,实现普惠 |
征信数据专家George(刘志军)
近日,央行对八家征信机构的验收工作已经收尾,预计牌照将于近期正式颁发。各大征信机构推出的个人征信产品成为关注的焦点。据悉,各家征信产品均是利用各自独特的数据为客户评分或评级,也就是说,各家机构给同一个人打分,分数也会有高有低。对于中国市场来说,征信数据还属“新鲜事物”,那么这种“分数”是否真正具备“公信力”,多种不同的评价体系是否会形成壁垒,对应用行业又会产生什么样的作用?我们先来看看美国市场。
美国是征信市场发展非常成熟的国家,上世纪50年代,其征信市场呈爆发式增长,直至1956年,工程师BillFair和数学家EarlIsaac成立了FairIsaac公司,共同发明了著名的FICO评分方法,一统江湖。随着市场的发展,美国有关个人信用的数据主要由三大信用管理局,即Experian、Equifax和TransUnion来提供。然而时至今日,FICO评分仍然是美国最通用的个人信用评分模式。
FICO评分方法的实质,是应用数学模型对个人信用报告包含的信息进行量化分析。该模型主要的评估内容是客户以往发生的信用行为,其对近期行为的衡量权重要高于远期行为,该模型包含以下五个方面的因素:
(1)以往支付历史。占总影响因素的35%,主要包括:各种账户的支付信息;负面公共记录以及诸如破产、抵押等报告事项,账户及应付款的违约情况以及公共记录的细节;支付账户未出现延期的天数。
(2)信贷欠款数额。占总影响因素的30%,主要包括:各种不同类型账户的欠款数额、有信贷余额的账户的数目等。
(3)立信时间长短。占总影响因素的15%,主要包括:信用账户开立的最早时间、平均时间;该客户使用某个账户的时间等。
(4)新开信用账户。占总影响因素的10%,主要包括:新开立账户的数目、帐龄;贷款方查询客户信用状况的次数、间隔时间等。
(5)信用组合类型。占总影响因素的10%,主要包括:客户拥有的信用账户类型、数目,各种类型的账户中新开立账户的数目及比例;不同信用机构的信用查询次数、间隔时间等。
曾在Equifax多年任职首席统计学家的George表示:“模型的实质是靠找到人的本质特征来预测行为,我们在美国做的所有案例都表明金额征信数据是最能代表人的本质特征,别的数据达不到这样的效果。只有算法而没有适合建模的数据,由此得到的模型预测效果不理想。”由此可见,模型建立的难点之一,是找到适合建模的数据。该专家从技术的角度进一步解释:“评价模型效果的指标可以参考KS(Komolgorov-Smirnov)和Lift Chart。模型的好坏和KS(Komolgorov-Smirnov)指数不是线性关系,KS在25以下基本是随机模型,KS在70以上实际中基本达不到,FICO在美国的模型差不多在50左右。
截至目前,国内各家征信公司已陆续推出自己的主打征信产品,阿里旗下的芝麻信用分、腾讯信用分、拉卡拉的“考拉分”、中诚信征信的“万象分”、华道征信的“猪猪分”、前海征信的“好信度”等已陆续上线或开始内测,并且已经开始尝试和机构合作测试。
同时,笔者了解到,目前各家的数据使用场景也没有太大差异。腾讯征信、阿里征信以及前海征信纷纷表示,在已经开发的征信产品中,主要是为P2P、小贷公司、消费金融以及中小银行提供相关的风控管理支持。而传统的征信机构也在耕耘这一领域,如鹏元征信、上海资信等,均将网贷、小贷、消费金融公司作为“主打战场”。
那么,这些征信数据的使用者,如何看待这些五花八门的征信产品和数据呢?
George目前是国内首家互联网消费金融公司马上消费金融的首席数据官,他对记者表示,对于消费金融公司来说,征信数据的应用是非常重要的,甚至可以说是业务能够顺利流转的重要一环。
消费金融领域的两大类主要风险是欺诈风险和个人信用风险。
1. 欺诈风险是主官预谋的,是犯罪行为。这种风险的防范要靠事前模式识别和事后的信息共享以及执法。
2. 信用风险是由人的行为模式决定的,模式的改变需要有主观的认识和有意识的纠正。目前我国个人征信起步不久,个人信贷不够普遍,需要正确的引导和教育来让消费者意识到信用的价值,改正一些行为模式以增加和维护信用。
3. 信用风险的管理关键在于识别风险和找到对应措施。识别风险的最佳方式莫过于精确的量化每一个消费者的信用风险,对应措施莫过于对消费者有一个全面了解,了解他们的行为,了解他们对消费金融的价值,然后有一个量化的价值和风险的平衡。
“这些正是我们有丰富经验和知识的地方,是我们的能力所在。发挥这些能力需要大数据支撑,需要我们不但能获取数据,还要自己建立模型整合数据。”George表示。马上消费金融将在充分利用征信数据的基础上,结合各类数据信息,自主开发信用风险模型。
前不久,央行等十部委发布了“关于促进互联网金融健康发展的指导意见”,“指导意见”中也明确提到了数据共享合作。对此,George特别说到,“数据不应该是壁垒,不应该是准入条件,相反应该对称、共享。这是对全社会有益的是,更是对互联网金融蓬勃发展,良币驱劣币的有益的事。我们愿意建立公开平台分享数据,甚至分享我们有知识产权的数据产品。这个行业的健康蓬勃发展不是一家做大,而是通过竞争、创新降低成本,包括数据、资金、市场、运营,提高用户体验,最终实现实实在在的普惠。”
|
|
|
|