三地五中心 螞蟻金服金融行業安全最高標準技術開放 光纜挖斷業務照樣用
可能還有一些人記得 3 年前發生了一件被微博刷屏的事件,2015 年 5 月 27 日下午 5 點,很多用戶發現支付寶不能用了,不僅查不到自己存在支付寶的余額情況,也無法辦理任何轉賬業務,當時支付寶官方也沒有對此情況作出及時回應,導致一部分用戶出現恐慌,直到晚上 7 點半左右才開始逐步恢復正常。支付寶官方微博對此的解釋是:
由于杭州市蕭山區某地光纖被挖斷……
雖然這件事情并沒有影響到用戶的資金安全,也并沒有對支付寶造成太大的影響,但卻成為網民調侃互聯網公司的素材,不管那些互聯網公司怎么厲害,抵擋不住藍翔畢業生挖掘機的一鏟子……
盡管光纜被挖斷并不是支付寶的責任和問題,卻給支付寶深深地思考,在當年都可以支撐住雙 11 高達 571 億元的交易額, 但卻敗在一條實實在在的光纜之下,更有好事者質問既然有支付寶有那么厲害的技術,但容災處理和修復卻耗費了那么長的時間呢。
一位支付寶的技術人員在事后也私下和記者表示,盡管支付寶已經對類似的情況進行過多次容災演練,而且也已經開始具備異地部署的工作,但礙于當時的技術限制,不僅成本高而且還可能會出現數據不同步的情況,反而會造成更多的麻煩。
不過,現在再也不用擔心這樣的問題了。

在 2018 年的云棲大會 ATEC 峰會現場,螞蟻金服 CTO 胡喜當著現場 2000 多人的注視下,主動剪短支付寶多個機房的光纜,在 40% 的服務器在突然無法工作的情況下,只用了 26 秒,系統就完成智能切換,實現自愈,用戶資金、數據 0 丟失。
一雪前恥。
這是由支付寶工程師策劃的一次特別技術演練,他們基于支付寶的真實機房,在兩個城市各單獨搭建了兩個模擬機房,以測試當兩個機房同時下線后的系統穩定性。
現場大屏有個二維碼,觀眾掃碼就能登陸一個虛擬賬號體驗。兩個機房斷網后的約 20 秒內,賬戶頁面顯示系統異常,20 秒后,觀眾全部都能順利轉賬了。
胡喜解釋,這次是演習。而在真實環境下,如果支付寶部署在兩個城市的兩個機房同時出問題,跑在這兩個機房上的支付寶賬戶恢復正常的速度是分鐘級。

據了解,這一機房架構叫「三地五中心」,即在三座城市部署五個機房,一旦其中一個或兩個機房發生故障,支付寶的底層技術系統會將故障城市的流量全部切換到運行正常的機房,并且能做到數據保持一致且零丟失。
記者了解到,目前互聯網和金融科技行業普遍采用的是比此低一級「兩地三中心」部署架構,即在一個城市設兩個機房,在另一個城市設一個冷備機房。
胡喜強調,這個架構,絕不僅僅是多設立了兩個機房那么簡單,它非常考驗一家公司分布式架構、數據庫、中間件及相關金融核心技術的能力。而這正是支付寶創立前十年修煉技術內功的結果。「支付寶的技術目標之一就是保證金融級別的系統穩定和安全能力。」
曾有行業人士做過概率計算,兩個城市多個機房同時故障的概率極低,基本不會發生。
開放能力
互聯網時代,服務器機房可謂心臟,大型機房出故障是小概率事件。但即便如此,還是可能出現自然災害、斷電、光纜被挖斷等黑天鵝事件。如果沒有完善的容災系統,不能及時恢復,就會出現用戶信息丟失、資金損失的情況,后果不堪設想。
此次現場演示的容災系統,這也是螞蟻金融科技開放的技術解決方案之一。根據剛剛上線的螞蟻金融科技官網顯示,全面開放的技術菜單多達數百種,包括金融安全技術、海量金融交易技術,金融風控技術等;行業解決方案則包括數字銀行解決方案、數字保險解決方案。

而一些前沿創新的技術能力也同樣在開放「菜單」內,比如區塊鏈技術。據知識產權產業媒體 IPRdaily 2018 年的最新統計,螞蟻的區塊鏈專利申請數蟬聯第一。目前這些技術被用于房屋租賃、商品溯源等領域,「均是為了解決現實問題」,胡喜說,「這也體現了螞蟻暖科技的技術價值觀」。
據介紹,螞蟻金服及支付寶的技術開放可分為三階段:2004 年成立之初,支付寶便致力于用技術解決實際問題。隨著業務突飛猛進,技術不斷修煉內功,達到行業領先,這是 1.0 時代。
2015 年開始,螞蟻金服提出互聯網推進器計劃,發布螞蟻金融云,并「成熟一個,開放一個」,將成熟的技術加速開放給合作伙伴,這是 2.0 時代。
2017 年 9 月,螞蟻金服董事長兼 CEO 井賢棟在阿里投資者大會上宣布,螞蟻金服已經實現自營業務的 100% 開放。
而現在,螞蟻金融科技正式宣布進入了 3.0 時代:支付寶對內延續 BASIC 戰略,對外開放的技術越來越完整、越來越核心,是成建制、有體系的全面開放,并實現了技術商業化。支付寶與 200 多家合作伙伴一起,為行業提供通用和行業解決方案。