大家在借唄或者銀行的信用貸借錢的時候,第一步是讓你授信,看看你的信用能夠貸到多少錢?那么金融機構是如何知道你的信用狀況呢?
圖片
在金融機構開展信貸業務、進行風控管理的過程中,征信數據是十分關鍵且重要的基礎數據,它客觀反映了征信主體的信用狀況。以人行二代征信數據為例,其中存在極其豐富的個人信息、信貸交易明細等數據,那么如何從中快速挖掘衍生出有價值的指標成為了信貸業務開展、風險控制管理的重要工作,本文就講講金融機構通常是如何使用征信數據的。
征信報告究竟長什么樣子呢?以人行二代征信報告為例,征信報告分為簡版和詳細版本,簡版可以直接在人行官網發起查詢,而詳版需要線下去網點查詢。下圖是人行簡版的截圖:
圖片
通常人行征信報告包含以下內容:
通常情況下,金融機構的信貸系統不會直接連人行征信系統,而是通過征信前置系統進行上報、查詢。
圖片
xml一般好幾M,內格式大致如下:
圖片
不同廠商的征信前置系統會對原始的征信報文做簡單的加工,比如轉成json,或者去掉部分信息,然后給到信貸系統。
現在獲取到征信指標的報文,可以利用里面的征信數據加工衍生出各種各樣的指標。基于對征信數據的充分挖掘,包含個人信息類、賬戶行為類、逾期類等12個指標大類,細分為37個指標小類,形成衍生指標1600多個,可實現對征信信息精細且全面的覆蓋。
圖片
現在要基于征信數據構建出一套征信指標體系,必然需要搭建一套系統去支撐,那么該如何做呢?
圖片
整個信貸征信指標平臺分為2個大模塊,管理模塊和執行模塊。
1、管理模塊面向指標管理人員,主要用于指標通過SQL或者界面拖拉拽的方式快速開發出征信指標,然后發布出去。
2、執行模塊面向行內業務系統,接收管理平臺的變量配置,負責將清洗解析后的原始報告數據,按照管理平臺配置的變量邏輯進行同步并行計算,得到最終的變量結果。
整個征信數據處理流程如下:
圖片
通常情況下,決策系統等外部應用系統請求征信前置機獲取征信報文,返回的格式可能是xml、json或者html。征信報文通常包含身份信息單元、婚姻信息單元、信貸交易信息概要信息單元、借貸賬戶信息單元等內容。然后調用征信指標衍生平臺暴露的接口,傳入相應的征信報文。
征信指標衍生平臺解析原始的報文數據,轉換成平臺中的58張內存表(數據模型)中,包括身份信息、婚姻信息、借貸賬戶基本信息、借貸賬戶最近24個月還款記錄信息等。
利用接入的統一數據模型,通過sql或者界面拖拉拽的方式配置衍生指標的邏輯。
征信指標的計算分成了實時和異步兩種方式。
實時即線上接口調用的場景,將決策所需的變量(一般50個左右,一般不超過300個)實時計算返回,對時效性要求較高,需要在內存中進行計算解析。
異步,通俗來說就是“攢數”的場景,方便后續策略迭代時,對歷史變量的回溯,對時效性要求不高,但變量數量龐大(多達數萬)。為不影響線上決策,實時和異步往往要隔離資源進行計算。
具體的計算引擎采用基于Apache Calcite作為SQL處理引擎,Apache Calcite 這一個開源的SQL查詢引擎,提供標準的SQL語言,查詢優化,連接數據源的能力,但是它不負責存儲和管理數據,只需要編寫對應的插件即可實現從內存的表中計算出指標。采用Calcite方式的另外一個好處,相對于內存數據庫,性能更好,因為即便內存數據庫也需要有數據庫落庫的開銷,本身數據庫的ACID等特性也會影響到查詢的性能,Calcite就不存在這樣的問題。
對于實時場景下,指標直接通過接口返回,用于后續的決策。異步場景,指標計算的結果可以落到數據庫中,其他系統自己主動來獲取。由于單客戶單報告的變量變量能達到數萬甚至數十萬,累計一段后,數據量將會很大。一般建議只存儲近期數據。而存儲形式上,對每個變量做列式存儲是不現實的,將本次報告的所有變量以單層json的形式存儲在一個字段下。
征信指標管理系統實現了一站式指標開發、計算、發布、迭代和管理功能,極大地降低了征信指標衍生加工的難度。而且采用內存的計算方式,保證了系統的性能,后續還可以納入企業征信、稅務、工商、司法等更多外部數據,為整個信貸業務賦能。
本文鏈接:http://www.www897cc.com/showinfo-26-19902-0.html信貸系統中是如何使用征信數據?
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 讓Java起飛的技術...