人工智能三個(gè)發(fā)展階段的驅(qū)動(dòng)力:技術(shù)、數(shù)據(jù)與場(chǎng)景

【編者按】 人工智能 發(fā)展至今,歷經(jīng)60年,技術(shù)永遠(yuǎn)是在不斷地突破,當(dāng) AlphaGo戰(zhàn)勝李世石引爆了新的輿論點(diǎn),有人擔(dān)心人類會(huì)面臨滅頂之災(zāi),機(jī)器人意識(shí)的覺醒令人類充滿好奇與恐懼,但是機(jī)器人的進(jìn)化也是需要時(shí)間的,以下便從核心驅(qū)動(dòng)力講述了推動(dòng)人工智能發(fā)展的核心驅(qū)動(dòng)力。
本文首發(fā)于大數(shù)據(jù)雜談,作者楊慧;由億歐編輯整理,供業(yè)內(nèi)人士參考。
2016年, AlphaGo 戰(zhàn)勝李世石引爆了新的輿論點(diǎn),人工智能(AI)以及其背后的機(jī)器學(xué)習(xí)(machine learning)、深度學(xué)習(xí)(deep learning)進(jìn)入了更多人的討論視野。HBO最近推出的人工智能題材連續(xù)劇《西部世界》又再次激發(fā)了人們對(duì)人工智能的關(guān)注,人們開始思考,未來(lái)的世界會(huì)不會(huì)真的有人工智能意識(shí)覺醒的那天。不過(guò),在擔(dān)心人工智能是否會(huì)打敗人類之前,不妨先仔細(xì)思考一下人工智能是怎么產(chǎn)生的。
▌人工智能的驅(qū)動(dòng)力是什么
就目前而言,人工智能的產(chǎn)生需要足夠的硬件能力支撐、匹配的機(jī)器學(xué)習(xí)算法和充足的數(shù)據(jù)資源。人們常提到, 大數(shù)據(jù)與人工智能將會(huì)是未來(lái)發(fā)展的兩大趨勢(shì),這容易讓人誤解為這是兩個(gè)平行、獨(dú)立發(fā)展的領(lǐng)域。 但實(shí)際上,大數(shù)據(jù)是人工智能發(fā)展的基礎(chǔ),人工智能的發(fā)展往往是緊隨大數(shù)據(jù)的發(fā)展。按照華裔人工智能專家吳恩達(dá)(Andrew Ng)的說(shuō)法是, 數(shù)據(jù)是人工智能的燃料,如果只有很大的引擎(算法)而沒有充足的數(shù)據(jù)作為燃料,人工智能這艘火箭是無(wú)法實(shí)現(xiàn)騰飛的。
按照各個(gè)時(shí)期不同的驅(qū)動(dòng)力,我們可以將AI的發(fā)展分為三個(gè)階段:數(shù)據(jù)技術(shù)驅(qū)動(dòng)階段、數(shù)據(jù)驅(qū)動(dòng)階段和情景驅(qū)動(dòng)階段。三個(gè)階段的AI發(fā)展對(duì)數(shù)據(jù)的要求各不相同,但從總體上看,人工智能與大數(shù)據(jù)之間是同生同漲的有機(jī)關(guān)系。每一次人工智能的增長(zhǎng),大數(shù)據(jù)行業(yè)都起著重要的推動(dòng)作用。數(shù)據(jù)量級(jí)的增長(zhǎng)、計(jì)算能力的提升、存儲(chǔ)效率的優(yōu)化、數(shù)據(jù)可分析程度的提高……都在加快人工智能的發(fā)展。其中,數(shù)據(jù)是人工智能發(fā)展的一個(gè)重要的競(jìng)爭(zhēng)優(yōu)勢(shì)來(lái)源。
▌人工智能1.0:技術(shù)驅(qū)動(dòng)
人工智能發(fā)展的第一個(gè)階段,是集中誕生基礎(chǔ)理論的階段。這個(gè)階段奠定了人工智能發(fā)展的基本規(guī)則,并誕生了基本的開發(fā)工具,為日后人工智能的研發(fā)工具的升級(jí)開辟了先河。在這個(gè)階段,技術(shù)的發(fā)展,尤其是算法的發(fā)展,成了推動(dòng)人工智能進(jìn)步的最大動(dòng)力。達(dá)特茅斯會(huì)議之后,人們對(duì)于算法程序和語(yǔ)言開發(fā)投入了極大熱情,掀起了人工智能發(fā)展的第一波高潮。
公認(rèn)的人工智能發(fā)展起點(diǎn)是1956年于美國(guó)達(dá)特茅斯學(xué)院舉辦的第一節(jié)人工智能會(huì)議。盡管這次會(huì)議并未達(dá)成普遍的共識(shí),但是卻為會(huì)議確定了主題:人工智能。第一批的人工智能研究從此開始。
1946年,人類歷史上第一臺(tái)電子計(jì)算機(jī)ENIAC誕生,盡管它有點(diǎn)笨重,但是毫無(wú)疑問(wèn)廣泛應(yīng)用于人工智能和計(jì)算機(jī)領(lǐng)域。計(jì)算機(jī)與編程算法的相繼出現(xiàn),從技術(shù)層面推動(dòng)了人工智能的發(fā)展。研究者們樂(lè)此不疲地運(yùn)用新的算法和計(jì)算工具去解決應(yīng)用題、證明幾何定理、學(xué)習(xí)和使用英語(yǔ)……每一次的成功都進(jìn)一步增強(qiáng)了人們對(duì)人工智能的信心。他們甚至認(rèn)為“ 在二十年內(nèi),機(jī)器將能完成人能做到的一切工作 ”。這一目標(biāo)顯然是高估了人工智能發(fā)展速度。
計(jì)算機(jī)性能的瓶頸、計(jì)算復(fù)雜性的指數(shù)級(jí)增長(zhǎng)、數(shù)據(jù)量的缺失,使得人工智能的研究停滯不前,人們逐漸對(duì)人工智能的發(fā)展逐漸喪失信心,人工智能研究進(jìn)入了第一個(gè)低谷期。
▌人工智能 2.0:數(shù)據(jù)驅(qū)動(dòng)
人工智能發(fā)展的第二個(gè)階段,是數(shù)據(jù)推動(dòng)人工智能更新迭代的階段。 這個(gè)階段,可獲得和分析的數(shù)據(jù)飛速增長(zhǎng),不僅磨練和提高了計(jì)算的能力,使人工智能的大規(guī)模運(yùn)算成為可能,并且也反過(guò)來(lái)倒逼了數(shù)據(jù)的采集、清洗和積累,以及相應(yīng)的軟硬件基礎(chǔ)設(shè)施的發(fā)展——這些都帶動(dòng)了大數(shù)據(jù)行業(yè)的騰飛。 大企業(yè)在這個(gè)階段發(fā)揮出了規(guī)模優(yōu)勢(shì),成為了推動(dòng)人工智能發(fā)展第二波高潮的主要?jiǎng)恿Α?/strong>
從1981年IBM推出第一臺(tái)個(gè)人電腦起,到1993年美國(guó)政府宣布實(shí)施“國(guó)家信息基礎(chǔ)設(shè)施”計(jì)劃,也就是我們常說(shuō)的信息高速公路,電子計(jì)算機(jī)與信息數(shù)據(jù)從實(shí)驗(yàn)室走進(jìn)普通人的生活,人工智能的研究不再只是局限于實(shí)驗(yàn)室的理論,針對(duì)日常生活的具體應(yīng)用也在不斷增多。在這一階段,數(shù)據(jù)主要從兩方面來(lái)影響人工智能的發(fā)展:
一方面,大量的數(shù)據(jù)要求人工智能不斷提高其計(jì)算能力。 信息時(shí)代數(shù)據(jù)量的快速增長(zhǎng),對(duì)整個(gè)人工智能的處理水平提出了更高的要求。人類大腦對(duì)數(shù)據(jù)的處理是十分強(qiáng)悍的,人的大腦擁有幾百億個(gè)腦細(xì)胞,每個(gè)腦細(xì)胞大約有幾百條腦神經(jīng),每條腦神經(jīng)上又有幾百個(gè)突觸,每個(gè)突觸的作用又相當(dāng)于一塊計(jì)算機(jī)芯片。
計(jì)算機(jī)人工智能如果想要實(shí)現(xiàn)與人類相似的智能水平,就必須要具備相應(yīng)的計(jì)算能力。1997年,IBM“深藍(lán)”在世界象棋中戰(zhàn)勝世界棋王卡斯帕羅夫, 最重要原因就是其強(qiáng)悍的數(shù)據(jù)處理能力 。在研發(fā)過(guò)程中,IBM研制小組向”深藍(lán)“輸入100年來(lái)所有國(guó)際特級(jí)大師開局和殘局的下法。“深藍(lán)”每秒能夠進(jìn)行2億次的運(yùn)算,能夠通過(guò)計(jì)算預(yù)判之后的12步,對(duì)比做出最優(yōu)的決策。
另一方面,大量的數(shù)據(jù)也在不斷地訓(xùn)練著人工智能。 數(shù)據(jù)量的增加對(duì)人工智能而言,不是負(fù)擔(dān),而是財(cái)富,因?yàn)閿?shù)據(jù)能幫助訓(xùn)練人工智能,使結(jié)果更加精準(zhǔn)。回顧“深藍(lán)”,令人驚嘆的計(jì)算能力并不意味著它就是堅(jiān)不可摧的。深藍(lán)在1996年第一次挑戰(zhàn)時(shí),就以2:4敗給卡斯帕羅夫。在之后的一年,研發(fā)團(tuán)隊(duì)引入美國(guó)特級(jí)大師本杰明,將他對(duì)象棋的理解變成程序教給“深藍(lán)”。此外,在與卡斯帕羅夫每一場(chǎng)對(duì)戰(zhàn)后,都不斷挑戰(zhàn)系統(tǒng)參數(shù),強(qiáng)迫“深藍(lán)”進(jìn)行學(xué)習(xí)。
如果說(shuō)主要作為實(shí)驗(yàn)室研究成果的“深藍(lán)”并不足以說(shuō)明數(shù)據(jù)對(duì)于人工智能的重要性,那不妨看看目前占據(jù)位居全球市值TOP5中的谷歌與 亞馬遜 。谷歌的搜索引擎與亞馬遜的智能推薦系統(tǒng)都是人工智能的具體應(yīng)用領(lǐng)域,在大量數(shù)據(jù)的訓(xùn)練下,無(wú)論是谷歌的搜索結(jié)果,還是亞馬遜的推薦結(jié)果,都越來(lái)越精準(zhǔn)——這構(gòu)成了兩家數(shù)據(jù)公司的核心競(jìng)爭(zhēng)力。
▌人工智能 3.0:情景驅(qū)動(dòng)
人工智能發(fā)展的第三個(gè)階段,是情境推動(dòng)人工智能更深入到具體應(yīng)用的階段。 隨著人工智能的技術(shù)發(fā)展和數(shù)據(jù)積累,行業(yè)逐漸發(fā)現(xiàn)短期內(nèi)通用智能和強(qiáng)人工智能是難以實(shí)現(xiàn)的,數(shù)據(jù)分布的情境化特性使得人工智能在特定情境下的垂直發(fā)展成為了可能。
這個(gè)階段,新的實(shí)用情境的識(shí)別與發(fā)現(xiàn),以及對(duì)該情境的人工智能解決方案的研究,極大的推動(dòng)了人工智能行業(yè)的前進(jìn)。移動(dòng)互聯(lián)網(wǎng)時(shí)代,各種移動(dòng)終端設(shè)備的出現(xiàn),使得數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)的增長(zhǎng)。相對(duì)于之前,現(xiàn)階段的“數(shù)據(jù)”包含的信息量越來(lái)越大、維度越來(lái)越多,從圖像、聲音等富媒體數(shù)據(jù),到動(dòng)作、姿態(tài)、軌跡等人類行為數(shù)據(jù),再到地理位置、天氣等環(huán)境數(shù)據(jù)……按照以往數(shù)據(jù)處理的思路已經(jīng)難以適應(yīng)“數(shù)據(jù)”本身的發(fā)展。這對(duì)于人工智能應(yīng)用者來(lái)說(shuō),既是驚喜,又是挑戰(zhàn),因?yàn)橐粋€(gè)融合人類智慧、人工智能以及海量數(shù)據(jù)的智能數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。
在圍棋領(lǐng)域戰(zhàn)勝人類的AlphaGo已是人工智能的典型代表, 但除了AlphaGo,人工智能研究中更多的是各種具體應(yīng)用。 2011年,蘋果推出語(yǔ)音虛擬助手 Siri ,讓人們開始體驗(yàn)“人機(jī)對(duì)話”,當(dāng)用戶懶得輸入時(shí),便可以直接詢問(wèn)Siri。盡管Siri剛推出時(shí)的回答經(jīng)常讓人啼笑皆非,但是大量的數(shù)據(jù)訓(xùn)練使Siri的語(yǔ)音識(shí)別越來(lái)越精準(zhǔn),反饋的答案也讓用戶越來(lái)越滿意。2014年,亞馬遜推出語(yǔ)音智能家庭管家Echo,人們無(wú)需觸碰手機(jī),就能直接喚醒Echo,讓其完成指令,享受智能家居。
人們更能感受到的是生活中的各類推薦系統(tǒng)(比如圖書、音樂(lè)、新聞相關(guān)的手機(jī)App),在搜集用戶的個(gè)性化數(shù)據(jù)之后,利用機(jī)器學(xué)習(xí),為用戶反饋出獨(dú)一無(wú)二的結(jié)果。一直將自己定義為科技公司而非媒體公司的“今日頭條”便是利用數(shù)據(jù)獲取成功的典型案例。大量場(chǎng)景化的數(shù)據(jù)為人工智能應(yīng)用于各種情景提供了發(fā)展的土壤,沒有數(shù)據(jù)就不會(huì)有智能。李開復(fù)也曾提到, 人工智能更適合于擁有大數(shù)據(jù)、且數(shù)據(jù)量可以實(shí)現(xiàn)自我推動(dòng)的公司,沒有數(shù)據(jù)的人工智能是無(wú)法前行的。
情景驅(qū)動(dòng)對(duì)應(yīng)用型人工智能企業(yè)的數(shù)據(jù)處理能力提出了要求。企業(yè)不僅需要采集數(shù)據(jù),還需要利用深度學(xué)習(xí)將這些數(shù)據(jù)轉(zhuǎn)化為人工智能的“知識(shí)”,最后根據(jù)企業(yè)的需求,轉(zhuǎn)化為相應(yīng)的應(yīng)用決策。
也就是說(shuō), 應(yīng)用型的企業(yè)至少要形成縱向的生態(tài)鏈,才能實(shí)現(xiàn)完成整個(gè)場(chǎng)景閉環(huán)。 令人慶幸的是,有些公司提供的智能數(shù)據(jù)平臺(tái)能夠協(xié)助企業(yè)完成整個(gè)數(shù)據(jù)流程的服務(wù),讓企業(yè)無(wú)需重新開發(fā)一套自己的平臺(tái)系統(tǒng)。以TalkingData的智能數(shù)據(jù)平臺(tái)(SmartDP)為例,SmartDP能夠提供數(shù)據(jù)管理、數(shù)據(jù)科學(xué)、數(shù)據(jù)工程的能力,企業(yè)能夠利用這一平臺(tái)與自己的具體產(chǎn)業(yè)行業(yè)相結(jié)合,全面利用數(shù)據(jù)創(chuàng)造更多商業(yè)價(jià)值。
▌結(jié)語(yǔ)
互聯(lián)網(wǎng)的發(fā)展將大家?guī)肓舜髷?shù)據(jù)的時(shí)代,而智能數(shù)據(jù)時(shí)代是大數(shù)據(jù)時(shí)代的新的階段。人工智能與大數(shù)據(jù)一樣,對(duì)社會(huì)經(jīng)濟(jì)起到賦能的作用,幫助人類感知、認(rèn)知、分析和預(yù)測(cè)這個(gè)世界。
對(duì)于人工智能這艘火箭,算法是引擎,數(shù)據(jù)是燃料。 當(dāng)行業(yè)日漸開放,越來(lái)越多的算法選擇了開源,此時(shí)數(shù)據(jù)便成為了影響人工智能成敗的關(guān)鍵點(diǎn)。豐富、多維度的情景化數(shù)據(jù)使人工智能更多更深的被應(yīng)用起來(lái),而人工智能的深度應(yīng)用,又產(chǎn)生了更加海量、精準(zhǔn)、高質(zhì)量的面向情景的數(shù)據(jù),為模型的進(jìn)一步優(yōu)化提供了條件。
對(duì)于未來(lái),我們相信,人工智能和大數(shù)據(jù)將會(huì)共同發(fā)展,給人類帶來(lái)更加智能的生活。