36氪專訪人人貸顧崇倫(下):為什么說互聯網信貸的大數據夢,離現實還很遙遠?
在對人人貸COO顧崇倫的上一篇專訪中,我們著重討論了該公司的模式選擇問題。站在我個人角度,之前對于人人貸的一些困惑——包括“暗箱”與透明,線上還是線下等問題——多多少少得到了解答。今天這篇專訪是對上一篇的承接,關注焦點由人人貸放大到P2P行業,目標仍然是為外界解答我們此前對于這個行業的一些疑惑和誤解,比如關于國內外P2P的本質差別,以及技術的能力界限等。
以下進入正文,詞句有所修改:
一、互聯網信貸不“互聯網”,源于外部數據電子化和整合程度不夠高
這個其實已經是業界共識,中國的征信體系欠發達,而且開放程度有限(比如只有銀行和當事人才能調用征信報告),導致一些P2P要么模式比較重,要么干脆是輕審核的狀態。雖然國家層面有一些數據庫(包括央行和其他機關),政府也在推動信用數據的整合和開放,但沒走到這一步的時候,基本只能依靠企業自主整合來實現。
站在企業自主整合的角度,目前可以有學歷、工商、第三方征信等開放數據,在用戶授權下,也可以拿到電商、社交等私密數據。比較理想情況下,借款用戶只需提交一個身份屬性,平臺即可以獲取完整的數據拼圖。而當你做不到的時候,只能讓用戶自己填寫上傳資料,此時會涉及到一個數據校驗的問題。
目前國內做P2P的邏輯是這樣:先考慮用戶的數據拼圖里需要哪些資料,能夠電子化獲取的就電子化,不能做到的,就讓用戶自主上傳,然后通過其他線上或線下手段驗證——P2P的互聯網化,會是一個逐步演進的過程。
二、征信是P2P的核心,大的玩家都會往這個方向走
很多P2P企業,包括人人貸和陸金所,其實都想往征信的這個方向去走。大家想做征信,很大程度上也是因為自己鏈條里缺失這一環。如果國家先做了,民間當然不用自己做,但就現狀而言,更多還需要民間去推動這一進程。
一般來說,真正的互聯網信貸需要先搜集數據,然后做數據驗證,之后再根據歷史壞賬、交易記錄做審核模型。這個模型,簡單說有一些評分法,復雜一點的會做數據挖掘。 目前包括人人貸在內,各家在這一點上做得其實并沒那么好。 在數據獲取都比較困難的前提下,各種模型也只能不斷嘗試和研究。但即便如此,一些公司和機構的在數據整合上還是會走得很快。民間走得快,國家也會跟進得快一些。國家想要將民間的一些動作規范起來,這就要求國家在數據整合和開放上的行動更加迅速。隨著P2P的受監管地位被明確下來,相信得到認證的P2P非常有可能拿到央行征信接口。
三、國外P2P和國內P2P,關鍵差異在于是否提供保障機制
在顧崇倫看來,國外的P2P模式其實跟國內不那么可比。 但是否提供保障機制,是兩者的一個關鍵差異。
Lending Club在對借款人評級的時候,能拿出一個相對公允的評級標準(FICO),這是公眾比較認同的。國外公眾長期受到信用教育,明白不同信用數值的意義,認同不同信用得分借不同金錢的觀念。這樣用戶可以自擔風險,平臺審核工作可以變得很輕,這才能做成比較純粹的交易所模式。
但國內情況是缺少這么一套公認的評級標準。平臺自己去做評級,用戶不知道你給出的信用等級是什么意思,因此才衍生出了本息保障一類的東西,這是歷史演變的結果。理論上,本息保障、承諾收益都是不應該存在的,整個金融行業都不能做收益承諾。但現實來看,中國幾乎沒有一家P2P不提供某種形式的擔保。即便是一些聲稱不參與風險的類Lending Club模式的P2P,也在用戶投資標的分散的前提下提供“有限保障”。
平臺不提供保障,用戶不知道憑什么做出投資決策。而且如果平臺只盯著交易量,不管風控,也會衍生出道德風險。 風險誰來管,保障就由誰來做,風控者的身份應該和保障者合一 ——不管是自己擔保,還是由第三方做保險擔保的模式,其實都是這個邏輯。
【重點】四、互聯網信貸,最核心的還是結構化數據,大數據的作用十分有限
在人人貸看來,非結構化數據對互聯網信貸更多的起到輔助作用,這一點長期可能也不會變。顧崇倫表示,國外的信用評估模型發展了這么多年,至今還是主要依靠借款人的收入、借款歷史、聯系方式和居住地穩定性等傳統金融數據做評估,恰恰說明了這些結構化數據的核心地位。
而對于一些非結構化數據,比如社交大數據,因為其缺少明確定義、不規整的特性,只能去做一些主動性的挖掘和探索。 如果你做的是結構化數據,比如10個變量對應1個結果,可以通過一些數據挖掘算法找到不同變量對結果的影響權重及其是否顯著有效等,結構化數據是可挖掘的。但如果是非結構化的數據,比如社交應用中的文字,你很難直接使用并且找到它對結果的影響,這樣的數據價值就比較低。
面對這些大數據,挖掘者不知道什么東西對自己有用,只能去猜測條件和結果之間的關聯,驗證關聯性后,才能把它當做一條規則來用。比如針對借款人,雖然你可以在他的搜索行為(比如有無檢索過“信用卡套現”這類關鍵詞)和逾期率之間做挖掘,但事實上,這里對數據的運用還是基于人的思考。人先想到,再用數據驗證,然后才成為實施方案——這樣的東西是很難反向挖掘的。
[ 36氪 原創文章,作者: 沈超]