同盾科技李曉林:知識聯邦——打造基于隱私計算的共享智能平臺
【雷峰網】2021年12月9日-2021年12月11日,2021第六屆全球人工智能大會(GAIR 2021)于深圳開幕。本屆大會由粵港澳大灣區人工智能與機器人聯合會、雷峰網聯合主辦,深圳市人工智能與機器人研究院、深圳市機器人協會、深圳市人工智能學會支持。
作為中國最具影響力和前瞻性的前沿科技活動之一, GAIR 大會已經度過了五次精彩而又輝煌的歷程。
大會第二天,以《直面數據安全風險和挑戰;挖掘隱私計算的100%可為》為主題的“數據安全與隱私計算”分論壇吸引了來自全國各地的專家、學者、企業家、投資人等,大家齊聚一堂共話新時代下“數據安全與隱私計算”的當下與未來。
其中 同盾科技合伙人兼人工智能研究院院長、中科院醫學所首席教授李曉林帶來了題為「知識聯邦——打造基于隱私計算的共享智能平臺」的精彩演講 。演講要點可概括為以下幾個方面:
-
?政策法規對于數據安全和隱私保護的合規性要求進一步加劇了數據孤島效應,成為數據共享瓶頸。數據的價值沒有充分發揮。數據也同樣有時間價值,要實現價值就必須通過時間和空間上安全合規的流通。
-
實現知識的共享互通機制來充分發揮數據的價值,首要問題是保障一致性。包括數據、內容一致性和連接上的一致性。
-
為了真正實現打破數據孤島,同盾科技打造了基于隱私計算的開放共享平臺。核心是智邦平臺iBond,下層是智邦的內核iCore。
-
知識聯邦是一個統一的多層次框架,從信息層、模型層、認知層到認知層,融合了多種安全多方功能,比如基于數據安全交換協議FLEX等等,有效利用多個參與方的協議標準,真正實現數據可用不可見,知識共創和共享。
-
打造全面互聯互通參考模型FIRM模型。這是一個多層次的互聯互通參考模型,把互聯互通分為五個層次,包括平臺層、通信層、數據交換層、算法層、應用層。
-
基于知識聯邦的理論框架、互聯互通的FIRM模型、智邦平臺iBond的支撐,近一步打通數據流通,那么無論是數據的提供方、使用方還是應用開發者、提供方或使用方,都可以在上面發布數據、應用模型。使用者可以按使用付費,實現價值變現。
-
同盾科技的目標是想為中國在下一代可信AI引領全球的道路上作出貢獻。
?
同盾科技合伙人兼人工智能研究院院長、中科院醫學所首席教授李曉林
?
以下是李曉林演講全文,雷峰網 (公眾號:雷峰網) 做了不改變原意的整理與編輯:
大家好,我是李曉林,來自同盾科技,今天我分享的主題是“知識聯邦——打造基于隱私計算的共享智能平臺”。我將從建設這個平臺的行業背景、平臺的架構、平臺的理論框架和平臺的應用幾個層面逐一展開解釋。
數據隱私保護已成為各界的關注重點,尤其從最近推出的一系列的法律法規,比如《數據安全法》、《個人信息保護法》等中可以體現。對于數據安全和隱私保護的合規性要求進一步加劇了數據孤島效應,成為數據共享瓶頸。同時,國家也把數據作為一個重要的新型生產要素,提升到了國家戰略級別。保護數據和數據共享有一定的沖突。數據作為一種生產要素和其他生產要素有很大區別,比如容易失控,保護更難,而且數據的復制幾乎是零成本。目前數據共享的程度比較低,數據生命力在各個孤島上面,價值沒有充分發揮。
我們說數據是新型“石油”或者新型“貨品”,金融的價值是空間和時間上的流通,從銀行貸款是把錢從銀行轉到你的口袋里,你用貸款來的錢做一些事情,未來再返還回去,是要付出代價的,今年的價值和未來一年后的價值是有時間差別的。數據也同樣有時間價值,要實現價值就必須通過時間和空間上的安全合規的流通。比如說電力系統有很多用電的數據,這些數據是用來收費的,數據價值有用但比較有限。如果我們把它的數據價值充分發揮出來,用來做企業信用分析,比如對企業經營狀況的判斷和參考,價值就非常大了,而且數據價值是有時間差別的,去年的企業用電量和今年的企業用電量這一數據價值是不一樣的。
為了保護數據隱私,還要發揮數據價值,實現數據的安全合規流通。我們已經知道業界推出了一系列的隱私計算技術手段,例如多方安全計算(MPC)、聯邦學習(FL)、可信執行環境(TEE)等等,通過打破數據孤島來增強數據的流通價值。而與此同時,隨著各家隱私計算平臺的推出,每個平臺也是孤立的,又形成了新的數據群島。此時就迫切需要打破平臺之間群島的壁壘。
要真正實現知識的共享互通機制,從而來充分發揮數據的價值,首要問題是保障一致性。一致性包括兩個方面,一個方面是連接上的一致性,另一方面是數據、內容的一致性。連接上的一致性包括任務一致和同時啟動,同時做同一個任務,計算節點一致、狀態一致。流通內容包括參數、算法、模型,加密的流程、手段、順序等都要一致,以及日志一致,以方便監管。
為了真正實現打破數據孤島、數據群島,我們打造了基于隱私計算的開放共享平臺。核心是智邦平臺iBond,下層是智邦的內核iCore。這一整套系統是基于云原生的平臺,目前有一系列的組件,包括管理數據市場i-data、管理應用市場SAFE和數據沙箱FORT,管理算法市場Caffeine、數據安全流通機制FLEX協議,以及聯邦通信框架—離子鍵 Ionic Bond。我們可以看到, FLEX提供了數據安全流通的一系列協議,Caffeine提供了算法算子的算法庫,SAFE提供了API和開發的SDK。 上面是知識聯邦的理論框架,從信息層、模型層、認知層到認知層,全方位的來融合知識。
知識聯邦是一個統一的多層次框架,融合了多種安全多方功能,比如基于數據安全交換協議等等,有效利用多個參與方的協議,真正實現數據可用不可見,知識共創和共享。
知識聯邦的信息層有兩項MPC,做一些安全計算查詢、密文上的訓練。模型層有點像聯邦學習,這兩個和既有的技術有一些重合,但是從認知層和知識層看,有我們的獨創性。知識聯邦超越了國外的初級聯邦學習,是國產原創引領的一個可信AI原框架。認知層能夠分流知識,這個知識本身不會因為一次性使用丟失,而是能夠傳遞下去,能夠進一步進行知識推理、知識融合、知識表達。
我們為了支持各方面的流通,打通孤立的數據頻道,打通平臺間的壁壘。去年我們提出了FLEX協議,這是一整套的開源標準化的聯邦協議,是可信AI的HTTPS。HTTP是是因特網上應用最為廣泛的一種網絡傳輸協議,所有的 WWW 文件都必須遵守這個標準。我們提出FLEX協議,也是希望能夠在一個互聯互通的標準下去使用數據,這也是業內首個聯邦平臺的互聯互通協議,已經開源了,PPT右下角是我們的開源鏈接,我們也發布了FLEX白皮書。FLEX本身包括一個應用協議和公共組件,以及各種密碼安全協議等等。
在此基礎上,我們進一步提出全面互聯互通參考模型FIRM模型。這是一個多層次的互聯互通參考模型,把互聯互通分為五個層次,包括平臺層、通信層、數據交換層、算法層、應用層。比如說平臺層,我們是智邦iCore內核,通信層是智邦Caffeine組件,在通信層數據流通的速度是開源的6倍左右。平臺層是做一些用戶的同步,啟動任務、停止任務等等。通信層是信息傳輸,是數據安全交換,前面已經提到了。算法層可以做一些算法的存儲類型及算法延伸。SAFE是場景的產生背景,場景的APE、SDK。
有了互聯互通,有了iBond,有了智邦平臺的支撐,有了知識聯邦的理論框架,我們就可以進一步打通數據流通。基于合規的互聯互通,我們進一步打造出數據的要素市場,即智邦iData。通過iData可以安全合規地使用多種多樣的數據,提升各種模型算法的精度,有一系列可以自主編程、自主建模的輔助工具。下面是iCore,它能夠實現公有云、私有云、混合云,支持億級別乃至十億級別的數據,是一站式數據安全合規的市場。
無論是數據的提供方、使用方還是應用開發者、提供方或使用方,都可以在上面發布數據、應用模型。使用者可以按使用付費,實現價值變現。我們也有一系列按照市場機制的數據定價,或者根據數據貢獻度的判斷來給出合理的價格。
有了這些平臺和數據,我們就可以支持很多應用。剛才所說的知識聯邦的四個層次都有豐富的應用,例如信息層,我們可以做一些安全合規的保護條件的查詢,比如說SQL很簡單的select,從A和B的數據,或者兩個表去合join。對查詢方也做一些安全措施,例如密語分享、同態加密等。
上面是模型層,我們可以打通數據源和金融機構的數據,做跨樣本或跨特質的聯邦學習。通過運營商或電網的數據能夠對企業征信進行豐富描述,更準確地判斷企業的運營情況,作出合適的風控建模和風險評估。
在認知層,可以通過多方預測來判斷。例如做反欺詐,有了信息層的多方數據融合和計算,模型層有一些模型的判斷,這時候從認知層的知識分流提出了分流嵌套特征,作為支撐來更進一步提升反欺詐評分卡,結合其他征信機構的數據,一起來做行業內部和行內的聯邦信用風險的模塊,作出最后的判斷。
在知識層,我們可以通過聯邦社交推薦來做精準營銷。例如電商公司A和游戲公司B,或者通過不同的企業業主、企業社交網絡、企業高管的社交網絡來判斷企業本身的經營狀況以及是否存在欺詐團伙。
?
剛才說的知識聯邦模型、互聯互通協議以及我們的智邦產品和iData要素市場,都能夠在私有云、公有云和混合云上做隱私計算和模型學習,提高交換的安全性。前面云原生的服務,我們同盾也有豐富的經驗,例如我們的平均響應達到了200毫秒級別的,已經打造了T4級別的毫秒級的機房,可以做到杭州和上海一體雙戶,并注冊了上萬臺的虛擬機,日流量超過一億。所以我們有充分的技術積累和經驗來支撐復雜的隱私計算共享智能平臺。
同盾科技是智能分析決策的布道者、國產化的開拓者,已經服務了一萬多家企業客戶,覆蓋了非常多的行業,包括政務、互聯網、銀行、保險等等,積累了豐富的客戶經驗。我們的目標還是比較遠大的,希望為中國在下一代可信AI方面引領全球作出貢獻。要達到這個目標需要群策群力,需要社區一起努力。
所以我們在去年的全球人工智能技術大會上創立了“知識聯邦產學研聯盟AKF”,通過企業、產業和研究院所、大學,形成知識聯盟,企業的應用場景給研究院所,還能夠向學生和教授團隊提供前沿的技術方案和智能算法。同時一些前沿的研究也能夠給企業帶來新的方向,指引戰略方向、輸出人才。通過AKF和知識聯邦,我們希望可以共同打造中國特有的下一代可信AI。目前已經有知名的高校和企業加入我們,我們也歡迎在座各位企業或者大學、世界頂尖的研究院所加入我們,共同打造下一代可信AI,為中國下一代可信AI作出貢獻。
??? 下面我來做一個總結。同盾的目標是做一個連接器,通過聯防聯控的獨立第三方角色,聯邦安全交換和充分互聯互通,來幫助各個行業充分發揮數據的價值,通過人工智能持續強化學習,通過前沿算法來支撐智能,同時開源、開放聯盟,合作共贏。
謝謝大家!
雷峰網原創文章,未經授權禁止轉載。詳情見。