清華大學教授孫富春:《人工智能與產業騰飛》

10月12日,第七屆中國智能產業高峰論壇在佛山開幕,在第一天的主論壇上,中國
人工智能
學會認識系統與信息處理專業委員會主任,清華大學教授孫富春發表了主題為《人工智能與產業騰飛》的精彩演講。
孫富春教授深入淺出地回顧了人工智能的前世今生,并從產業的角度介紹了人工智能與現有產業如何深度融合,實現產業鏈條的形成以及制造業的騰飛。在報告中還為與會嘉賓展示了其團隊的科研課題和科研成果,并對人工智能的未來進行了思考和暢想。他提出,我們應構筑我國人工智能發展的先發優勢,加速產業建設,加快邁向“中國制造2025”。
以下是對孫富春教授演講的整理:
尊敬的各位嘉賓、各位同仁、大家上午好!我首先非常感謝學會給我跟大家交流的機會,我匯報的題目是《人工智能與產業騰飛》。
談到人工智能我們不能不提到圖靈 ,圖靈在1950年在《計算機能思維嗎》提出了著名的圖靈測試,就是人和機器背靠背,讓人提問題,機器回答,如果有30%的機器回答讓人感覺到是像人回答的,我們就說這個機器具有智能,他建立了人工智能的思想基礎。我們經常講是計算技術推動了人工智能的發展,用哪些計算呢?首先是云片計算機,是它主要推動了現代人工智能的發展。還有哪些計算呢?網絡計算、互聯網技術推動了群體智能的發展。還有生物計算,以生物計算主導的人工智能,一定是未來人工智能發展的重要方向。我覺得現有的智能是沿著這三條線索分別在發展,同時部分有交叉,但是以獨立的發展為主。
我們過去講人工智能有兩大范式,一個是符號主義,就是利用數學里的數理邏輯,通常稱它為知識驅動的人工智能。第二部分我們講是聯接主義,就是神經元,一直到現在的深度學習,稱為 數據 驅動的人工智能。 人工智能的第三范式是什么呢?我們認為是神經機制驅動的人工智能,包括今天李院士講到的深度學習,最早是1958年,人們對貓視覺皮層的發現而建立起來了。今天的超限學習機,包括強化學習都是基于腦科學和生物學的發現,他們就是基于神經機制驅動的腦認知。
人工智能有很多的領域,我們覺得這段時間發展比較多的應該是 機器學習 和機器感知,機器感知包括語音處理技術、圖象識別技術等等。目前人工智能已經應用在自然語言處理、知識表達、自動推理、機器學習、計算機視覺和 機器人 。 人工智能時代人和機器之間應該是一個雙向的關系,機器有感知和決策能力,有認知能力,可以跟我們一起工作,協同完成某項任務,我們今天講到的人機混和智能就屬于這個方面。 最近有一本書,是王飛躍老師的學生王曉翻譯的,我還為該書寫了一個序,就講到了社會機器問題,這是一個新的社會生態,人和機器共存的社會。
我們再談深度學習 ,深度學習是1958年約翰霍普金斯大學的David Hubel和Torsten Wiesel教授一個重要的發現,他們發現了人的視覺信息處理是分級的,這個發現大大促進了人工智能的發展。
我們說深度學習是一個端到端的學習,它跟我們傳統的模式識別有什么不同呢? 就是自動選擇特征。深度學習的產品現在應用在移動終端里面,像蘋果的Siri,微軟的智能安全工作空間。問一下什么是“深度學習”,只要同手機說一下,SIRI馬上會告訴你強化學習的意思。強化學習剛才我們李院士講的比較多,我這里就不再多說了。
我們看到阿爾法狗把所有圍棋高手都打敗了,那么大家會產生一個映像,人工智能將來不得了。但我認為以深度學習為代表的人工智能存在這么一些缺陷,第一個是端到端黑盒子,網絡中存在大量的復雜非線性變換和大規模神經元連接,少量的隨機擾動就會導致最后結果的劇烈變化,其行為和表現難以理解和合理解釋,很難對模型的行為進行有效分析,無法找到原因并進行修正。
我們提出這樣一個觀點,我們認為在深度學習的之前的模式識別是算法加特征,這些特征是人自己選定的,比如說顏色特征,紋理特征,幾何特征等等,數據加進來干什么? 數據加進來就是供自動提取特征。我們再看,現在的深度學習只用到了算法和數據,其實人在觀察事物的過程里面還用了一個很重要的東西,就是模式。深度學習這兩年有了很大的進展,一個重要的因素就是視覺、聽覺、觸覺,腦電都可以用二元矩陣表示,深度學習可以推廣到這些領域。人在觀測事物時,觀測模式不一樣,白天大多用到視覺,操作物體用觸覺,有時把這幾個感知信息融合在一起。好,我們再看看行為。行為是人工智能一個非常重要的部分,但是現在的深度學習沒有做到這一點。我們再向上看,我們研究了特征,我們需要什么?概念,這就是可解釋性的問題。此外,我們還需要知識和模型。我們看看現在的深度學習僅僅做到了我畫的這一小塊,而且還不夠完善。
剛才強調一個很重要的問題,需要很多數據,如果沒那么多怎么辦? 就是小樣本表示學習是目前非常重要的一個風向,怎么做呢?我需要大量的數據,這實際上是一個正則化的問題,我們通過正則化,通過流形學習可以改變這個問題。還有一個問題很重要,就是如何產生數據。學自動化的人都知道,模型可以產生數據,如果將模型的產生式方法和機器學習的判別式方法結合,有望解決數據的產生問題。這就是今天強調的對抗式學習,它是把產生式方法和鑒別式方法結合在一起,通過競爭產生新數據,這是目前小樣本學習里面非常重要的一個方向。
符號概念,關聯網絡的概念這是今年谷歌Deepmind公司提出來的,它直接通過這樣一個網絡,通過概念的組合來形成從感知到概念的轉化。 這種新的符號-概念關聯網絡,實際上打破了純粹模擬人腦神經網絡生物構造的計算方式,從模擬人的“組合性”思想中另辟蹊徑,從而取得了對抽象概念這一特定問題的進展。
圖像理解最近大家做的比較多,這是我一個博士生在做的工作,從任意給定的圖像,可以學習圖像的自然語義理解,實現了從單一目標的概念,到整體句子結構,最終實現圖像理解的過程,這是一個對圖像更深層次的理解過程。我們可喜的看到在今年溫哥華的IROS會上面,李飛飛也報告了怎樣從感知形成理解,這就是剛才講到的從特征到概念。
生物計算怎么樣?存儲量大、運算快,能耗特別低,DNA計算是普通電腦的十億分之一;存貯量大,1立方米的DNA溶液,可以存貯1萬億億的二進制數據。運算快,十幾個小時的DNA計算,相當于所有電腦問世以來的總運算量。我們再看看量子計算機,這個是今年的中國科學技術大學發布的量子計算機原形樣機,一臺操縱50個微觀粒子的量子計算機,對特定問題的處理能力可超過目前最快的“神威·太湖之光”超級計算機。加拿大神經外科醫生Wilder Penfield的實驗結果說明大腦對感知數據的記憶是全息的(即包含我們生活的所有細節),而并不是單純的一幅圖像、一種聲音或一種感覺,即使是對通常的事件。我認為未來的人工智能一定是這樣一個圖譜,從下面的硅 云計算 到生物計算(或者叫碳計算),最后到神經機制驅動下的強人工智能。這里我提出的觀念可能跟許多人不一致,可以討論。
人工智能的產業在中國現在是不斷的興起和發展,中國人工智能產業的規模2016年達到了100億元,增長率達到了43.3%,2019年我們國家達到了344億人民幣。 中國跟美國的差距我們看一下,從人工智能的企業數來看,我們大概有兩年的差距,但是從投融資角度來講我們差距還比較大,2017年美國是978億,中國是635億。我們再看看中美在人工智能各個領域,像自然語言理解、機器學習應用、計算機視覺和圖像、技術平臺,無人機等等,這方面我們跟美國還是有一定差距,尤其在自然語言理解、機器學習這方面我們差距比較大,我們國家在2016年的專利增長非常快,人工智能目前用在哪些地方呢?醫療、汽車、消費電子、電商、安防等等。
這是一個未來十年我們可以展望的,從現階段的 大數據 、感知、理解、機器人、自動駕駛里面,近期的主要是互聯網的應用、電商、商業流程的自動化、攝像頭、視覺語音語言手勢的應用、工業機器人等,未來3—5年可以看到輔助自動駕駛、商業機器人、VR和AR技術,分布式傳感器技術將在中國的產業方面有大的發展,包括人工智能+計算構架、算法框架加傳感平臺;未來5—10年,自然語言理解成為我們萬能的助手,甚至請一個外國人講課,你們聽到的是按他的語調的中國話。我們可以展望的未來十年可以達到全天候、全工況的 無人駕駛 。
人工智能在各個行業處于爆發狀態,像 芯片 、智能機器人,智能社交、智能交互和智能教育,下面我們來看一看。
人工智能芯片 主要包括GPU、PGA等等,人工智能時代的“晶體管”橫空出世。英偉達是深度學習芯片的龍頭跨國公司,我們沈總在這兒,英偉達推出深度學習芯片,Tesla P100能夠實現數百CPU服務器節點性能,數據處理速度是NVIDIA此前Maxwell架構顯卡系列的12倍。
機器人是人工智能產業的一個非常重要的支柱 ,未來十年里要大力發展機器人,它包括了執行、裝置、控制、感知系統等等,其實我今年參加了《國家機器人發展報告》的撰寫,明顯感覺到我們國家在一些傳統弱項方面進步仍然不是很大,包括像減速器、高密度高精度的電機、驅動系統,還包括一些分布式傳感器。這是我國研發的仿人機器人,這是京東做的物流機器人。我們國家現在已經形成了門類比較齊全的機器人研發基地,從東北一直到我們廣州。
我們講講未來發展,人工智能的發展已經從弱人工智能到了以大數據和深度學習為主的弱人工智能,最后到神經機制驅動下的強人工智能。我個人認為,人工智能將來最大的產業是算法加軟件和數據;第二是芯片,第三是智能教育,第四是共享平臺。將來你家的冰箱,電視機都是共享的,你將來從廣州搬到北京去什么都不用帶,一切獨有共享公司負責。另外還有產業服務,典型代表就是百度的天智系統。
謝謝大家!
研究報告分享
10月12日,億歐智庫,聯合阿里研究院、微鏈共同出品 《AI商業化“二次革命”的產業落地——2017中國AI投資市場研究報告》 。報告從三大產業鏈層次和18個重點行業,到投資機構市場布局和巨頭企業投資戰略,報告深入探索AI各投資領域的變化趨勢,總結AI投資市場主要“玩家”投資規律。
閱讀報告請點擊: 《AI商業化“二次革命”的產業落地——2017中國AI投資市場研究報告》