人工智能的三個階段:我們正從統(tǒng)計學(xué)習(xí)走向語境順應(yīng)
事物飛速發(fā)展之時,往往需要你停下腳步,回顧自己所處的位置,否則你會很容易陷入對細節(jié)的興奮之中。構(gòu)成人工智能基礎(chǔ)的數(shù)據(jù)科技正以不同的方式向前發(fā)展,而且速度飛快。因此,在你改變職業(yè)之前,或者決定使用人工智能擴展業(yè)務(wù)時,讓我們首先對人工智能做一個鳥瞰,以幫助理解我們所處的位置以及未來走向。
人工智能的三個階段
我們傾向于把人工智能看做新事物,尤其是新技術(shù)以及和深度學(xué)習(xí)相關(guān)的新技巧。然而,人工智能已經(jīng)過數(shù)十年的發(fā)展,否認過往的成功似乎不合邏輯,因為技術(shù)總是不斷向前發(fā)展。
當(dāng)我費力向其他人解釋人工智能之時,我不斷為預(yù)測分析尋找一些分界線,這些分析我們已經(jīng)實踐了相當(dāng)一段時間,也是大眾對人工智能持有的觀點。最近我讀到了一本名叫《人工智能的三次浪潮(Three Waves of AI)》的書,作者是 DARPA 信息創(chuàng)新辦公室主管 John Launchbury,他從一個更長遠和寬廣的視角,將人工智能的歷史與未來劃分為了三個階段:
1. 手工知識(Handcrafted Knowledge)階段
2. 統(tǒng)計學(xué)習(xí)(Statistical Learning)階段
3. 語境順應(yīng)(Contextual Adaptation)階段
Launchbury 的觀點對我?guī)椭鷺O大。盡管階段(ages)的比喻很有用,但是這很容易讓人誤解為一個階段結(jié)束了下一個階段作為替代才開始。與此相反,我把人工智能看作一個金字塔,其中下一階段的發(fā)展奠定在前一階段之上。這也清晰地表明了即使是最古老的人工智能技術(shù)也不會過時,且實際上依然在使用之中。
對于第二個階段統(tǒng)計學(xué)習(xí)(Statistical Learning),即我們目前所處的階段,我分為了一些更細的階段,因為第二個階段之中有一些重大突破值得單獨作解釋。
第一階段:手工知識
第一個階段的典型代表是「專家系統(tǒng)」(expert systems),其把大量知識轉(zhuǎn)化為由中小企業(yè)團隊精心制定的決策樹來增強人類的智能。專家系統(tǒng)的代表例子是 TurboTax 或者做調(diào)度的物流程序,它們在上世紀 80 年代已經(jīng)出現(xiàn),且很有可能更早。
盡管我們有能力運用機器學(xué)習(xí)統(tǒng)計算法諸如回歸、SVM、隨機森林以及神經(jīng)網(wǎng)絡(luò),且這些算法自上世紀 90 年代以來獲得了飛速擴展,但手工系統(tǒng)的應(yīng)用并未完全消失。最近 Launchbury 提及到該系統(tǒng)的一個應(yīng)用成功防御了網(wǎng)絡(luò)攻擊。大約在 2004 年之前,相似的系統(tǒng)實際上已經(jīng)成為自動駕駛車的核心(其失敗的主要原因是不能解釋所有的現(xiàn)實問題)。
Launchbury 認為專家系統(tǒng)在推理方面表現(xiàn)不俗,但僅限于幾個嚴格定義的問題,且沒有學(xué)習(xí)能力,不能處理不確定性問題。
第二階段:統(tǒng)計學(xué)習(xí)
第二個階段是我們現(xiàn)在所處的階段。盡管 Launchbury 傾向于關(guān)注深度學(xué)習(xí)方面的進步,實際上早在我們使用計算機尋找數(shù)據(jù)中的信號之時就已經(jīng)步入了第二階段。統(tǒng)計學(xué)習(xí)階段開始于數(shù)十年之前,但是在上世紀 90 年代獲得了牽引力,并通過處理新數(shù)據(jù)、容量甚至是數(shù)據(jù)流而不斷獲得擴展。
由于不斷增加的深度學(xué)習(xí)技術(shù)工具箱(比如回歸、神經(jīng)網(wǎng)絡(luò)、隨機森林、SVM、GBM),統(tǒng)計學(xué)習(xí)階段伴隨著從數(shù)據(jù)之中尋找信號能力的爆炸性增長應(yīng)運而生。
這是一種不會消失的基礎(chǔ)數(shù)據(jù)科學(xué)實踐,它可以解釋消費者(他們?yōu)槭裁磥怼槭裁戳簟槭裁醋撸⒔灰祝ㄊ欠翊嬖谄墼p)、裝置(它是否有問題)、數(shù)據(jù)流(30 天之后其價值是什么)的所有行為問題。統(tǒng)計學(xué)系對人類智能的增強是不斷發(fā)展的人工智能的部分之一。
在第二階段之中,至少有另外兩個重大突破極大地提升了人類的能力。第一個是 Hadoop 與大數(shù)據(jù)。現(xiàn)在我們已經(jīng)有了大規(guī)模并行處理以及儲存和查詢大的非結(jié)構(gòu)快速移動數(shù)據(jù)集的方法。2007 年 Hadoop 首次開源,直到現(xiàn)在。第二個小的突破是現(xiàn)代人工智能工具集的興起,其由以下 6 種技術(shù)組成:
1. 自然語言處理
2. 圖像識別
3. 強化學(xué)習(xí)
4. 問答機
5. 對抗式訓(xùn)練
6. 機器人
除了少數(shù)例外,這些技術(shù)可被整合為依賴于深度學(xué)習(xí)的一類,但是如果你查看深度學(xué)習(xí)工作方式以及深度神經(jīng)網(wǎng)絡(luò)運行方式的詳情,你很快會意識到這些并不是問題的核心。
在卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、生成對抗神經(jīng)網(wǎng)絡(luò)、強化學(xué)習(xí)之中的進化神經(jīng)網(wǎng)絡(luò)及其所有變體之中通常有很少;反過來在問答機(Watson)、機器人或者不使用深度神經(jīng)網(wǎng)絡(luò)的強化學(xué)習(xí)變體之中存在更少。
由于這些技術(shù)的共同之處是它們生成自己的特征,也許我們應(yīng)該稱之為無特征建模的階段(Era of Featureless Modeling)。你仍然不得不使用已知的標注實例進行訓(xùn)練,但是你不必在列中填入預(yù)定義的變體和屬性。它們在極其大的計算陣列上也需要大規(guī)模并行處理,很多次需要專業(yè)芯片(比如 GPU、FPGA)以在人類時間尺度上搞定一切。
因此,重要的區(qū)別就是第二階段的人工智能可以延續(xù)幾十年,并且其主要從機器學(xué)習(xí)、大數(shù)據(jù)/Hadoop 和無特征建模三個方面已經(jīng)對新技術(shù)進行了三次大的變革。但這些突破仍然在統(tǒng)計學(xué)習(xí)方法這一階段內(nèi),該階段還會繼續(xù)發(fā)展并產(chǎn)生更多的突破。
Launchbury 表明,到目前為止,我們已經(jīng)擁有非常先進、細分和強大預(yù)測能力的系統(tǒng),但是仍然還沒有理解語境和最小推理能力。因為我們的技術(shù)對數(shù)據(jù)有更大量的需求,這已經(jīng)成為了一個障礙,而對我們?nèi)匀挥袃r值和高效的預(yù)測分析技術(shù)并不應(yīng)該是這樣的。但我們在這個階段早期無法解決的困難,包括自動駕駛汽車、機器贏得日益復(fù)雜游戲的能力、圖像、文本和自然語言處理等方面目前都已經(jīng)取得了重大的突破。
第三階段:語境順應(yīng)(contextual adaption)
接下來呢?Lauchbury 說,當(dāng)前統(tǒng)計學(xué)習(xí)時代出現(xiàn)了兩個問題,第三個階段要解決兩個問題。
解釋推理行為的模型:雖然我們的深度神經(jīng)網(wǎng)絡(luò)善于分類,比如圖片,但是處理原理仍然顯得神秘莫測。我們需要既可以進行分類也可以得到解釋的系統(tǒng)。理解推理就能讓對處理過程的修正真正有效。
生成模型:這些模型可以從潛在語境中進行學(xué)習(xí),比如一個模型,掌握了每個字母的筆畫,而不是基于大量糟糕的書寫樣本進行粗暴分類。我們今天使用的生成模型有望顯著減少對訓(xùn)練數(shù)據(jù)的需求。
鑒于這些特點,處在這一階段的人工智能系統(tǒng)就能使用語境模型(contextual models)進行感知、學(xué)習(xí)、推理以及抽象,將從一個系統(tǒng)中學(xué)習(xí)到的東西應(yīng)用到一個完全不同的語境中。
全景視野
新階段的開始并不意味著前一階段會戛然而止。一些技術(shù)、功能的有用性或許會降低,但是完全被淘汰出局也不太現(xiàn)實。比如,最新技術(shù)所需的大量計算力、研發(fā)的復(fù)雜性以及訓(xùn)練都會制約這些技術(shù)退出歷史舞臺,將來某個時候出現(xiàn)的高價值的問題可能還會用到這些技術(shù)。
其他情況,比如語境采用階段,我們可能不得不等待新一代芯片的出現(xiàn),這類芯片更加類似人腦。這些被稱為神經(jīng)形態(tài)或者脈沖神經(jīng)網(wǎng)絡(luò)的第三代神經(jīng)網(wǎng)絡(luò)都會用到現(xiàn)在研發(fā)最早階段的那些芯片。
現(xiàn)在,我們處在第二階段(統(tǒng)計學(xué)習(xí))的什么位置?
當(dāng)前階段的三章內(nèi)容中,人們可能最關(guān)注的是新東西,深度學(xué)習(xí)、強化學(xué)習(xí)以及上述構(gòu)成該階段的六種技術(shù)之間的平衡。
這是一場演化的艱難過程,剛開始結(jié)出果實,但這些新的發(fā)展中絕大部分仍然沒有準備好開花結(jié)果。盡管可以看到這些技術(shù)會往哪個方向發(fā)展,但是,只有兩到三個技術(shù)有望可靠商業(yè)化(圖像處理、文本和語音處理,類似 Watson QAMs 的有限版本。)
當(dāng)你試著將這些技術(shù)擰在一起時,這些技術(shù)也不過是松散地在一起,集成這些技術(shù)仍然是最具挑戰(zhàn)性的事情之一。我們總會想到辦法的,只是還沒到這一步。
我們總會走到那一步的,甚至進入第三階段。不過,走過這一階段之前,或許還會出現(xiàn)我們未曾預(yù)料的演化或者變革。
End.
轉(zhuǎn)載請注明來自36大數(shù)據(jù)(36dsj.com): 36大數(shù)據(jù) ? 人工智能的三個階段:我們正從統(tǒng)計學(xué)習(xí)走向語境順應(yīng)