大數據時代征信業(yè)所面臨的挑戰(zhàn)
如何確保信息的準確性
為了迎合時代的需要,越來越多的信息涌入人們的生活,人們在享受數字化帶來的便利的同時,許多人會主觀臆斷的認為這些信息是準確的,如何確保自己所獲取的信息是準確的?這將是進入 大數據時代 人們所需要面臨的一大挑戰(zhàn)。在這個數據不斷膨脹的時代,人們毫無疑問需要一種科學算法,一種采集數據的方式,來確保得出的數據是正確的,但是試想一下,人類是無法確保所做的事情是毫無偏差的,那算法或者數據采集方式也同樣無法保證它們是完全正確的。
在美國八十年代,普遍獲取信息往往通過電話和傳真的方式,直接給某人打電話做調查,詢問一些問題。一個早晨一般能做25到30個電話尋訪。當時的信息獲取方式工作效率及其低下,但通過人與人之間的交流,確實能夠保證數據的準確性。當時的人無法想象30年后的今天,如此海量的數據主動或者被動的進入人們的視線,獲得這些數據的人可能根本就沒有與信息主體有過任何的交流,在這種情況下,就會出現所獲得的數據的質量以及完整性的問題。
作為征信行業(yè)的監(jiān)管者,在制定政策的過程中首先所需要確保的就是信息準確性問題。試想即便人類能夠創(chuàng)造出極其優(yōu)秀的計算機算法,只有當算法中的數據是準確的,這個算法才是有效的,如果數據收到了污染,或者缺失了,再優(yōu)秀的算法也是毫無用處的。在這個大數據時代,信息的源頭很難追溯控制,數據準確性的問題不僅僅對于整個中國市場,乃至對于全球的征信大環(huán)境來說也是需要面對的挑戰(zhàn)。
如何保證資信的公平公正
獲得大數據之后,首先需要重新思考的是,需要多少數據才能定位一個人。如何準確地衡量一個人是資信最重要的目標。但資信對所有人來說并不是公平的。例如有些高齡的消費者,不懂如何使用互聯網,網絡中自然就沒有他的信息。年齡,文化程度,認知度等各個方面都限制了這類人群的信息采集,顯然信貸對于他們來說是不公平的。
然而對于另外一些使用互聯網的人群而言,會有數據足跡留下,但這個過程中,信息主體自身是否具有選擇權?是刪除這些數據,愿意分享多少數據?每個人都應該有這樣的權利,但是事實確是令人失望的,至少有一部分信息主體是無法控制的。
所以對行業(yè)監(jiān)管者來說,必須考慮使用大數據的負面影響是什么?任何行業(yè)長久發(fā)展的基石是公平公正,同樣的不公平還存在于對少數民族的歧視,部分國家對性別的歧視等。對于傳統的信貸打分機制現已耳熟能詳,在過去的大多數國家,都會有民族和性別歧視這樣的問題,法律會禁止使用一些種族和性別方面的數據。
當數據采集者想要一些數據,可以通過云端進行挖掘,但是在這個過程中,沒有人能夠保證這些信息是完整的,是否有信息被過濾了,被屏蔽,被篩選了?所以很多情況下,公平這碗水是無法被端平的,信息篩選這會有所選擇,有些人會選擇分析他們想要分析的數據,將不希望出現的數據自動過濾出去,然后整理成一份所謂的匯總,顯然這份匯總是不公平的,是不完整的。在整個大數據鏈和生命周期中,首先需要考慮到數據收集的偏差性,如何保證資信的公平公正,是行業(yè)監(jiān)管者需要重新思考的問題。
信息的采集和使用是否合理
在人們當下的生活中,經常會遇到此類的情況發(fā)生,比如某項電子產品或者虛擬軟件,在使用之前都會有長篇大段的協議需要人們簽署,只有同意打勾后方可使用?在同意之前,是否有人看過這類協議的具體內容?絕大部分的人都不會去仔細看自己所同意的協議,根本不知道要使用這些軟件所需要簽訂什么樣的協議,不知道自己同意了什么內容。現在的情況就是,即便仔細看了條款,試問如果條款中有不明確的點,或者存在不合理的情況,那就真的不用這個軟件了嗎?答案顯然是否定的。人們不可能因為這個原因與互聯網社會脫節(jié),但是通過這樣的方式簽訂使用協議來采集信息顯然是不合理的。
征信行業(yè) 的參與者們不斷地在探討一個問題,就是如何保護消費者的信息和利益?消費者是否同意其他機構使用他的信息?現在人們的生活越來越離不開手機,當人們通過手機使用臉譜(Facebook),或者其他的一些軟件的時候,我相信絕大多數人都不知道自己殘留在這些軟件上的數據被誰獲取了,被用來做什么。同樣的問題還存在于公司的兼并與收購,數據從第三方經轉的二手數據,無人得知得知最后自己的信息將會落到何處。
信息的采集和使用是否合理,這個問題已經無數次被討論。從傳統的打分機制來看,如果有人對打分結果表示不滿,說分數不夠準確,評分明顯低了,但至少他能知道評分的依據,能知道這個分數是如何算出來的。例如不斷的去銀行貸款,不斷地轉換工作,這些都是評分依據。而在現在的數字化的環(huán)境中,由于信息量的不斷增多,評分的維度也不斷曾多,面對不同人格式各樣的情況,我們沒辦法保證基于大數據而創(chuàng)造出來的算法是合理的。通過不合理的方式采集來的信息,被可能不合理的算法加以計算,得出的結果是否可靠,答案顯而易見。
大數據時代是信息社會運作的必然結果,它令人類的信息社會更上一個臺階,但前提是能夠處理好它帶來的各種問題,這是每一個參與者都必須考慮的。從數據的采集到使用,從算法是否可靠到資信角度的公正,只有每一個環(huán)節(jié)都合理合規(guī)了,大數據為人們所帶來的能量才是正面的。征信行業(yè)的政策制定者,參與機構而言,需要迅速的改變自己,只有不斷地改變才能適應新時代的步伐。希望今后的監(jiān)管者能夠不斷地權衡,勇于承擔起變革的責任,制定與時代相適應的規(guī)則,同時加以創(chuàng)新,不被傳統思想所束縛,這樣大數據的未來才是光明的。
作者:彼得·什瑞(PeterSheerin),亞太中東征信協會專家。
注:本文來源于《中國征信》2016年第8期,版權著作權屬原創(chuàng)者所有,轉載請注明來源!
責任編輯:陳近梅