2017MWC上海站前瞻 亞信數據CTO於今詳解機器學習平臺Aura
2017世界移動大會?上海將于6月28日-7月1日舉辦。一向在市場活動方面頗為低調的亞信將在本次展會上高調登場,并將展出在人工智能、物聯網、大數據、亞信安全領域的最新研發成果和客戶案例。
活動前夕,亞信數據CTO於今接受媒體采訪,分享了亞信數據在人工智能方面的布局、產品進展以及熱點話題的看法。
作為業內頂尖的大數據和人工智能領域技術專家,在加盟亞信之前,於今博士曾擔任螞蜂窩副總裁兼首席架構師、OpenX(全球第二大廣告交易平臺,僅次于Google,支撐日均500億筆RTB交易規模)技術副總裁兼首席架構師、TriTech Tiburon執行技術總監等職位。在TriTech Tiburon期間,他所帶領的團隊負責開發公司的第二代產品線,包括核心警務系統及處理美國近30年的公安大數據,并整合社交大數據以預測未來犯罪。
於今重點分享了機器學習平臺Aura及應用案例。他首先闡釋了 亞信推出Aura的原因——降低人工智能的技術門檻 。一直以來,從事機器學習研究和應用往往需要計算機科學相關專業或有統計學豐富經驗的中高端人才,而傳統企業人才的技術背景難以匹配。 研發推出Aura平臺就是為了讓更多企業利用大數據和人工智能技術,享受技術所帶來的業務價值提升。
依托亞信的傳統優勢,Aura定義為運營商級別(Carrier-grade)的平臺,有如下幾個方面的特點:(1) 覆蓋面廣 —— 服務國內大部分人口;(2) 高穩定性 —— 達到了電信級別的SLA;(3) 高效率 ,模型相應速度非常快,滿足實時性需求。
從技術架構層面來看, Aura平臺可以分為三大子平臺 : 大數據平臺 、 機器學習平臺 、 數據驅動型應用平臺 。其中機器學習平臺是核心,它整合了業界主流的開源算法框架(例如TensorFlow、Caffe、Spark MLlib等),承擔模型訓練和優化的任務。在機器學習平臺之上的數據驅動型應用層則實現行業數據模型的高效重用。
據於今介紹,Aura里其中一個重要特色是 “統一數據模型”(Common Data Model, CDM) 。依靠CDM,機器學習模型可以快速在企業間移植,實現企業應用機器學習技術效率的大幅提升。 Aura的機器學習平臺提供兩個開發工具。 其中,Aura Visual Pipeline 提供向導式和情景化的快速模型定制。經過探索和實踐抽象出一系列典型的機器學習應用場景。針對每個場景,都將科學的分析建模過程形成一個向導式的流程。使用者只需要提供一些必要的信息,就可自動生成一個有效的應用模型,也使整個流程變得水到渠成。另一個工具Aura Advanced Notebook,支持多種編程語言,并基于瀏覽器界面操作。有助于快速調試模型。結合數據、算法,Advanced Notebook適于工程師精細的模型調整。
數據和模型之間建立反饋閉環
在於今看來, 在Aura平臺架構設計上,最重要的是數據和模型之間建立了反饋閉環。 機器學習技術日趨成熟,以往項目化的應用機器學習技術,往往只關注模型交付時的效率表現。而隨著時間的變化,模型的效果沒有新數據的增量訓練,往往會逐漸降低。這是因為數據和模型之間由于缺乏系統性和平臺級的支持,沒有形成反饋閉環。所以Aura機器學習平臺著力于這個痛點。Aura平臺上部署的模型采用自動化模型的再訓練機,保證模型持續的有效性。
隨后,於今還介紹了亞信Aura平臺在行業方面的案例。他在 電信運營商 方面重點介紹了三個場景:將用戶歷史信息和深度畫像結合,再與產品和服務的具體信息做精準匹配,預測客戶潛在需求并展開營銷動作;根據地理位置信息多維度預測用戶需求;通過收集運營商或電力等大型企業設備數據信息預測維修周期,設計維修方案,節約巡檢成本。
在 金融行業 場景,於今談到了有兩個主要場景,一個是實時反欺詐,一個是智能投顧。
最后,於今還詳細介紹了亞信人工智能平臺在 醫療醫保 控費和反欺詐方面的應用案例。以咸陽為例,亞信和咸陽市政府合作,把咸陽的全量醫療數據集中在陽關醫療云中。咸陽有30多家實體醫院,基 于三大類數據,比如影像數據、醫療設備IOT數據、EMR 數據,建立訓練模型,可以更精準的判斷醫療欺詐行為。
2017世界移動大會?上海即將開幕,期待在展區看到亞信更多的研發成果和客戶案例。