艾瑞咨詢(xún)分析師林仁翔:人工智能產(chǎn)業(yè)解析
編者注:本文根據(jù)主題為「人工智能為什么那么火?」的艾瑞互聽(tīng)會(huì)上,艾瑞咨詢(xún)分析師林仁翔「人工智能產(chǎn)業(yè)解析」的演講速記整理而來(lái)。
人工智能是什么呢?從我們的角度定義,就是讓機(jī)器人實(shí)現(xiàn)本來(lái)人類(lèi)智慧所完成的任務(wù),比如視覺(jué)識(shí)別,看到物體,聽(tīng)懂語(yǔ)言,把語(yǔ)言轉(zhuǎn)化成文字,甚至做自動(dòng)推理,模擬人類(lèi)學(xué)習(xí)和思考的過(guò)程。
人工智能的基礎(chǔ)
通過(guò)對(duì)大量的數(shù)據(jù)計(jì)算和處理,機(jī)器人才能完成原本人類(lèi)才能完成的任務(wù)。大家比較熟悉的是前一段時(shí)間 AlphaGo 與圍棋選手李世乭對(duì)弈的事情。如果要窮舉圍棋的可能性,有 10 的 360 次方種可能性,這什么概念?人類(lèi)目前可觀測(cè)的范圍內(nèi)的氫原子總共是 10 的 80 次方。所以這種量級(jí)運(yùn)算的話目前還是沒(méi)有辦法實(shí)現(xiàn),AlphaGo 能戰(zhàn)勝李世乭,是因?yàn)樗捎昧嗣商乜逶u(píng)估法和深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),這些高級(jí)算法的應(yīng)用才能實(shí)現(xiàn)讓機(jī)器去下圍棋這個(gè)事情,完成本來(lái)我們?nèi)祟?lèi)才能完成的任務(wù)。
所以,人工智能的核心是算法——使用更高效和性能的算法就能完成更高級(jí)的任務(wù)。
人工智能算法的基礎(chǔ)則是計(jì)算能力,這是第一個(gè)基礎(chǔ)條件。就是如果說(shuō)算的很慢,比如說(shuō)機(jī)器要算下一盤(pán)棋,就算十步算一天的話,這種運(yùn)算效率是完全沒(méi)有辦法進(jìn)行圍棋比賽的。第二個(gè)基礎(chǔ)是數(shù)據(jù),數(shù)據(jù)對(duì)于人工智能來(lái)說(shuō),就像經(jīng)驗(yàn)對(duì)于人,如果機(jī)器對(duì)于圍棋的數(shù)據(jù)沒(méi)有辦法處理和識(shí)別,就失去了這個(gè)基礎(chǔ)。
人工智能的發(fā)展路徑
人工智能發(fā)展依托 IT 信息產(chǎn)業(yè)的發(fā)展。首先是計(jì)算機(jī),計(jì)算機(jī)出現(xiàn),使得機(jī)器能夠儲(chǔ)存數(shù)據(jù)和計(jì)算。
第二是互聯(lián)網(wǎng),它的誕生使得機(jī)器能傳遞數(shù)據(jù),另外,用戶(hù)在互聯(lián)網(wǎng)上的行為也能沉淀大量數(shù)據(jù),這些數(shù)據(jù)都能交給機(jī)器處理。
第三是物聯(lián)網(wǎng),它讓更多的傳感器加入,能采集一些溫度、環(huán)境信息。物聯(lián)網(wǎng)介入之后,數(shù)據(jù)采集也能交給機(jī)器完成,提高了很多效率。以前的很多數(shù)據(jù)需要我們?nèi)斯ぽ斎耄辛宋锫?lián)網(wǎng)就能交給機(jī)器完成。
人工智能則是在數(shù)據(jù)應(yīng)用突破環(huán)節(jié),大家都談了很多大數(shù)據(jù),但是"大數(shù)據(jù)"大家不知道怎么用,這需要人工智能的算法和分析,實(shí)現(xiàn)應(yīng)用的價(jià)值。
最后由人工智能算法實(shí)現(xiàn)了數(shù)據(jù)應(yīng)用層面的突破。
總結(jié)起來(lái),人工智能第一個(gè)發(fā)展階段是在計(jì)算這個(gè)環(huán)節(jié),它能夠讓機(jī)器像我們?nèi)祟?lèi)一樣,開(kāi)始能存會(huì)算,像一些神經(jīng)網(wǎng)絡(luò)和遺傳算法出現(xiàn),使得我們?nèi)祟?lèi)能夠更高效、快速處理海量的數(shù)據(jù),這也是后面發(fā)展的基礎(chǔ);二個(gè)階段就是感知智能,就是讓機(jī)器能聽(tīng)懂我們的語(yǔ)言、看懂世界萬(wàn)物。這時(shí)候的代表產(chǎn)品,比如說(shuō)可以認(rèn)出罪犯的攝像頭,比如說(shuō)你有一些異常舉動(dòng),偷東西它就能發(fā)出警示,比如說(shuō)有犯人的人臉數(shù)據(jù)就可以識(shí)別,犯人在什么地方出現(xiàn)都能被發(fā)現(xiàn)。還有聽(tīng)懂人類(lèi)說(shuō)話的等等。就是像這些感知智能的技術(shù)出現(xiàn),可以幫我們?nèi)祟?lèi)更高效的完成聽(tīng)和看的任務(wù)。
第三個(gè)階段就是認(rèn)知智能,這時(shí)候就由機(jī)器去思考主動(dòng)采取了一些行動(dòng),就比如在自動(dòng)駕駛和一些能夠獨(dú)立完成任務(wù)的機(jī)器人。還有一些機(jī)器人做的醫(yī)生決策助理這樣的產(chǎn)品,這樣的東西出來(lái),機(jī)器人就可以開(kāi)始更全面輔導(dǎo)甚至部分替代人的工作。比如說(shuō)做手術(shù),人工智能最大的價(jià)值就是來(lái)代替或者輔助我們?nèi)祟?lèi)來(lái)完成一些任務(wù)。因?yàn)樗倪\(yùn)算效率非常高,同時(shí)可以快速?gòu)?fù)制,所以它能夠極大地提升人工作效率,解放我們的勞動(dòng)力。
可以預(yù)見(jiàn),在人工智能發(fā)展之后,有一些重復(fù)性的勞動(dòng)就很有可能就被機(jī)器替代,就比如說(shuō)利用一些機(jī)器手臂完成一些流水線的生產(chǎn),這些東西都是很典型的代表。所以從人工智能價(jià)值出發(fā),至少目前來(lái)看,人工智能是 B2B 生意,比如說(shuō)代替銀行去完成一些身份驗(yàn)證。比如說(shuō)刷卡,以后高鐵,機(jī)場(chǎng)進(jìn)站不要人來(lái)驗(yàn)票,這都是由機(jī)器來(lái)完成,降低機(jī)場(chǎng)和一些相關(guān)部門(mén)的成本。
人工智能的產(chǎn)業(yè)鏈的結(jié)構(gòu)
最基礎(chǔ)的一個(gè)部分就人工智能兩個(gè)基礎(chǔ)條件,一個(gè)是計(jì)算能力,一個(gè)是數(shù)據(jù)能力。所以說(shuō)計(jì)算和數(shù)據(jù)這兩個(gè)事情也是產(chǎn)業(yè)鏈的基礎(chǔ)。再到第二層的話就是剛才講到做核心算法的公司,他們做這種核心算法的研究,包括人工智能識(shí)別的算法等等,最上面一層的公司就是根據(jù)這技術(shù)去做一些應(yīng)用,就比如說(shuō)人臉識(shí)別的技術(shù)成熟之后,支付寶就拿人臉識(shí)別的技術(shù)去做身份驗(yàn)證,以后大家可以不要輸密碼,刷臉來(lái)做一個(gè)驗(yàn)證。
應(yīng)用的話又分兩類(lèi),有硬件產(chǎn)品的應(yīng)用,就比如說(shuō)機(jī)器人、無(wú)人機(jī),和其他的智能硬件等等硬件產(chǎn)品的應(yīng)用形式。還有一種是軟件服務(wù),就比如大家接觸到虛擬個(gè)人助手,比如說(shuō)度秘等等。
人工智能在當(dāng)下的發(fā)展
人工智能這幾年一個(gè)是依賴(lài)計(jì)算,就是摩爾定律,他到現(xiàn)在還沒(méi)有失效。另外一個(gè)是互聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù),這在兩個(gè)條件成熟后,2006 年,Hinton 等人提出了深度學(xué)習(xí), 在數(shù)據(jù)訓(xùn)練上取得了巨大的突破。其實(shí)是對(duì)特征量的多次抽象的一種算法,在這算法提出之后,非常適合大數(shù)據(jù)的處理運(yùn)算。再結(jié)合計(jì)算和數(shù)據(jù),這三個(gè)條件基礎(chǔ)成熟之后,使得人工智能的感知實(shí)現(xiàn)層面實(shí)現(xiàn)巨大的突破。大家可以看到現(xiàn)在語(yǔ)音識(shí)別和視覺(jué)識(shí)別的算法,它基本上識(shí)別率都達(dá)到了 95% 以上。在深度學(xué)習(xí)出現(xiàn)之前視覺(jué)和語(yǔ)音識(shí)別大概是在百分之六七十,我說(shuō)十句話六句話都聽(tīng)懂,這是沒(méi)有用。就是因?yàn)檫@種算法,數(shù)據(jù)和計(jì)算都成熟了之后,所以在感知層人工智能實(shí)現(xiàn)了一個(gè)突破。
那么認(rèn)知從什么時(shí)候突破?其實(shí)我們現(xiàn)在還不清楚。因?yàn)閱螁紊疃葘W(xué)習(xí)神經(jīng)網(wǎng)絡(luò)能不能夠讓機(jī)器去思考這個(gè)事情,我們還比較有疑問(wèn)。還有一個(gè)方向,是在做人腦的研究,就是想從腦科學(xué)實(shí)現(xiàn)認(rèn)知層的突破,這個(gè)非常依賴(lài)生物和一些相關(guān)學(xué)科的突破,因?yàn)檫@方面現(xiàn)在也還在探究的過(guò)程中。什么時(shí)候解決這問(wèn)題,不知道。所以說(shuō),人工智能在下一個(gè)階段發(fā)展會(huì)在什么時(shí)候?qū)崿F(xiàn),我們還不得而知。
雖然我們不知道機(jī)器什么時(shí)候能思考,但是它現(xiàn)在已經(jīng)能聽(tīng)會(huì)看,就是現(xiàn)階段科大訊飛這些公司在感知層做了一些產(chǎn)品,已經(jīng)實(shí)現(xiàn)了一些盈利,所以我們覺(jué)得基于目前的感知技術(shù),去實(shí)現(xiàn)人工智能的一些方面是有很大的機(jī)會(huì),而且這產(chǎn)業(yè)還是剛剛起步,不管是創(chuàng)業(yè)公司還是產(chǎn)業(yè)巨頭都是有很大的機(jī)會(huì)。
感知智能的普及也還需要 5 到 10 年,因?yàn)樗募夹g(shù)還要提升,這個(gè)技術(shù)不只本身識(shí)別的技術(shù)還有一些應(yīng)用化的技術(shù),就比如說(shuō)大家可能知道,去年有一個(gè)新聞,就是趙薇的老公,公證處是用人臉識(shí)別判斷身份,有人用趙薇的老公的照片完成了識(shí)別工作,使他受到了損失,這些在識(shí)別的公司,在這事情發(fā)生之后,他們就研究了活體驗(yàn)證的技術(shù),就不僅是認(rèn)一個(gè)人,還能知道你這個(gè)人是活人,還是拿的照片,就是在這些基礎(chǔ)上還要做一些技術(shù)應(yīng)用化的改良,這改良需要一個(gè)時(shí)間。
還有一個(gè)剛剛提到物聯(lián)網(wǎng),就是數(shù)據(jù)這一塊,物聯(lián)網(wǎng)也還不夠普及或者說(shuō)發(fā)展還需要時(shí)間。在這方面的話,我們前幾天部門(mén)分析師提了一個(gè)問(wèn)題,說(shuō)什么時(shí)候才能讓機(jī)器去吃紅燒肉,并且能知道這紅燒肉好不好吃?現(xiàn)在的機(jī)器人比較少能處理這味道和嗅覺(jué)的數(shù)據(jù),這就依賴(lài)物聯(lián)網(wǎng)的傳感器和其他相應(yīng)的產(chǎn)業(yè)發(fā)展。
最后一個(gè)是計(jì)算,因?yàn)楝F(xiàn)在人工智能的計(jì)算量非常大,去年出來(lái)一個(gè)事情,就是說(shuō)百度人工智能大賽的時(shí)候出現(xiàn)技術(shù)作弊的事情,雖然說(shuō)那個(gè)事情導(dǎo)致對(duì)百度的名聲不太好,但是這也震驚了業(yè)界,這個(gè)比賽規(guī)定說(shuō)你再一個(gè)公司或者說(shuō)一個(gè)團(tuán)隊(duì)在一周內(nèi)只能上傳一次數(shù)據(jù),結(jié)果那百度上傳了多次數(shù)據(jù)就判作弊,但是這事情的話,從另外一個(gè)方面說(shuō)明了百度現(xiàn)在的計(jì)算能力特別強(qiáng),就是別的公司是做不到,一周內(nèi)要處理這么大量的數(shù)據(jù),但是百度可以的,因此,計(jì)算也還是人工智能的一個(gè)瓶頸。所以,綜合來(lái)看我們覺(jué)得人工智能發(fā)展到大規(guī)模的普及還是一個(gè) 5 到 10 年的時(shí)間,對(duì)大家來(lái)說(shuō)還有很多的機(jī)會(huì)。
國(guó)內(nèi)的人工智能發(fā)展
中國(guó)人在這方面做得還挺好,可能是因?yàn)橹袊?guó)人數(shù)學(xué)比較好,在人工智能方面做的比較好,尤其是語(yǔ)音和視覺(jué)識(shí)別里面,中國(guó)還是處于世界頂尖的頂尖的,像訊飛和百度也是突破了 95% 的語(yǔ)音識(shí)別門(mén)檻。FACE++和湯曉鷗教授團(tuán)隊(duì),他們?cè)诟鱾€(gè)國(guó)際比賽里面完全有能力媲美 Google、Facebook 等巨頭企業(yè),這是我們技術(shù)的情況。
不管是說(shuō)像百度、阿里巴巴、騰訊這樣的巨頭企業(yè),在人工智能都有大量的突破,百度是號(hào)稱(chēng) 2014 年投了 70 個(gè)億,他們?cè)谶@里面做了很多的事情,包括他們成立了無(wú)人駕駛事業(yè)部這樣的事業(yè)部,推出了度秘。像阿里推出了大數(shù)據(jù)計(jì)算平臺(tái),昨天阿里推出阿里小 AI,還預(yù)測(cè)這一季《我是歌手》的冠、亞、季軍。像騰訊的話,他們干的就是推出自動(dòng)撰稿機(jī)器人,騰訊視覺(jué)識(shí)別平臺(tái)、探索實(shí)驗(yàn)室以及華為的諾亞方舟實(shí)驗(yàn)室,都能看得出來(lái),國(guó)內(nèi)的公司都有大量的投入和布局。
再看創(chuàng)業(yè)公司,截止到 2015 年的數(shù)據(jù),中國(guó)就是已經(jīng)有一百多家創(chuàng)業(yè)公司,其中有 65 家獲得融資,總?cè)谫Y金額在 29.11 億人民幣。大家也知道,艾瑞做了一個(gè)中國(guó)創(chuàng)業(yè)公司獨(dú)角獸的榜單,這里面有四家公司都屬于人工智能的領(lǐng)域。
人工智能投入了多少?在這四年的人工智能的投入都處于一個(gè)穩(wěn)步上升,去年總共有 43 起人工智能領(lǐng)域的投融資時(shí)間,總共的金額是在 14.23 億。今年企業(yè)融資大概有 4 個(gè)億,本來(lái) Q1 是屬于投資行業(yè)的淡季,但是這 4 個(gè)億可以看到中國(guó)人工智能能比之前的金額更高。
最后看一下細(xì)分領(lǐng)域分析,中國(guó)創(chuàng)業(yè)公司 70% 一直在做應(yīng)用,這是我國(guó)的一些行業(yè)現(xiàn)狀。我們?cè)讷@得 Google、Facebook 的研究技術(shù)并且開(kāi)源之后,我們很快把這技術(shù)應(yīng)用落地,但是對(duì)于原創(chuàng)的研究底層和中層,我國(guó)的創(chuàng)業(yè)企業(yè)還是不太行。但是我們?cè)谠谝曈X(jué)和聽(tīng)覺(jué)方面做了很多的應(yīng)用和很好的產(chǎn)品。
在應(yīng)用的類(lèi)型來(lái)看,大概是 83% 企業(yè)都是在做軟件服務(wù),硬件產(chǎn)品比如說(shuō)機(jī)器人是比較少。
我們?cè)賮?lái)看看做算法,55% 在做計(jì)算機(jī)視覺(jué),我們剛才已經(jīng)提過(guò)了華人圈在做視覺(jué)識(shí)別,確實(shí)是很牛的。其他,有 13% 在做自然語(yǔ)言處理,9% 進(jìn)行機(jī)器學(xué)習(xí)。