神經(jīng)網(wǎng)絡(luò)之父 Hinton 闡述 40 年的研究,或重塑 AI 技術(shù)
作為多倫多大學(xué)教授,Geoffrey Hinton于2012年10月將AI領(lǐng)域的發(fā)展推向了新的軌道。在兩名研究生的幫助下,Hinton展示了一種不太流行的技術(shù)——人工神經(jīng)網(wǎng)絡(luò)。Hinton已經(jīng)在這個(gè)領(lǐng)域研究積累了數(shù)十年,人工神經(jīng)網(wǎng)絡(luò)使得機(jī)器能夠理解圖像的能力有了巨大飛躍。
如今,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)可以轉(zhuǎn)錄我們的演講、識(shí)別我們的寵物,并幫助我們與“網(wǎng)絡(luò)巨魔”作斗爭(zhēng)。但Hinton現(xiàn)在卻對(duì)這種他幫助推出的技術(shù)發(fā)起挑戰(zhàn),他說:“我認(rèn)為我們研究計(jì)算機(jī)視覺的方式是錯(cuò)誤的。雖然它現(xiàn)在比其他任何東西都管用,但這并不意味著它是正確的。”
Hinton現(xiàn)在分享了他的另一個(gè)“舊想法”,這可能會(huì)改變電腦“觀看”的方式,并重塑AI。計(jì)算機(jī)視覺非常重要,對(duì)于無人駕駛汽車或充當(dāng)醫(yī)生的軟件來說更是如此。上周,Hinton發(fā)表了兩篇研究論文,闡述了他已經(jīng)研究了近40年的一個(gè)想法。他說:“在很長一段時(shí)間里,這對(duì)我來說都是一種直覺感覺,只是效果不太好。現(xiàn)在,我們終于取得了進(jìn)展。”
在第二種情況下,Capsule網(wǎng)絡(luò)幾乎將之前最好測(cè)試的錯(cuò)誤率降低了一半,這種測(cè)試挑戰(zhàn)軟件從不同角度識(shí)別卡車和汽車等玩具的難度。Hinton始終在與谷歌派駐在多倫多的兩名同事共同研究他的新技術(shù)。
Capsule網(wǎng)絡(luò)旨在彌補(bǔ)當(dāng)今機(jī)器學(xué)習(xí)系統(tǒng)的缺陷,這些缺陷限制了它們的有效性。谷歌和其他公司今天使用的圖像識(shí)別軟件需要大量的示例照片來學(xué)習(xí),包括如何在各種情況下可靠地識(shí)別對(duì)象。這是因?yàn)樵撥浖⒉簧瞄L將其對(duì)新場(chǎng)景知識(shí)進(jìn)行泛化,例如從新的視角觀看相同的對(duì)象時(shí),準(zhǔn)確地將其識(shí)別出來。
舉例來說,教電腦從多個(gè)角度識(shí)別一只貓,可能需要成千上萬張不同角度的照片。而人類孩童不需要如此明確和廣泛的訓(xùn)練,就可以學(xué)會(huì)識(shí)別一只家養(yǎng)寵物。
Hinton的想法是縮小最好AI系統(tǒng)和普通幼兒之間的認(rèn)知鴻溝,以便在計(jì)算機(jī)視覺軟件中建立更多的知識(shí)。 Capsule(少量粗糙的虛擬神經(jīng)元)被設(shè)計(jì)用來追蹤物體的不同部位,比如貓的鼻子和耳朵,以及它們?cè)诳臻g中的相對(duì)位置。由許多Capsule組成的網(wǎng)絡(luò)可以利用這種方式來加強(qiáng)理解,明白從不同視角看到的物品依然是此前相同的對(duì)象。

現(xiàn)在就說Hinton取得了“大躍進(jìn)”還為時(shí)過早,他自己也知道這一點(diǎn)。這位經(jīng)驗(yàn)豐富的AI專家的直覺已經(jīng)得到了證據(jù)支持,他解釋說Capsule網(wǎng)絡(luò)仍然需要大量圖像支持,并且當(dāng)前的系統(tǒng)與現(xiàn)有圖像識(shí)別軟件相比速度更慢。但Hinton非常樂觀,他自信可以解決這些缺點(diǎn)。該領(lǐng)域的其他人也對(duì)他的長期成熟想法抱有很大希望。
圖像識(shí)別初創(chuàng)公司Twenty Billion Neurons聯(lián)合創(chuàng)始人、蒙特利爾大學(xué)教授羅蘭·梅尼塞維奇(Roland Memisevic)說,與當(dāng)前系統(tǒng)相比,Hinton的基本設(shè)計(jì)應(yīng)該能夠從數(shù)據(jù)中提取出更多信息。如果能夠在更大范圍證明這一點(diǎn),那將會(huì)對(duì)醫(yī)療保健等領(lǐng)域有所幫助。在這些領(lǐng)域,用于培訓(xùn)AI系統(tǒng)的圖像數(shù)據(jù)遠(yuǎn)比互聯(lián)網(wǎng)上的自拍照更少。
從某些方面來說,Capsule網(wǎng)絡(luò)與AI研究最近的趨勢(shì)有所不同。最近對(duì)神經(jīng)網(wǎng)絡(luò)成功的一種解釋是,人類應(yīng)該把盡可能少的知識(shí)編碼到AI軟件中,然后讓它們自己從頭開始計(jì)算。
紐約大學(xué)心理學(xué)教授加里·馬庫斯(Gary Marcus)去年曾向叫車服務(wù)公司Uber出售了一家AI初創(chuàng)公司,他說,Hinton的最新研究代表了一種新的可能。
馬庫斯認(rèn)為,AI研究人員應(yīng)該做更多的事情來模擬大腦的內(nèi)在機(jī)制,來學(xué)習(xí)像視覺和語言這樣的關(guān)鍵技能。他說:“現(xiàn)在還不知道這個(gè)特定的架構(gòu)會(huì)走多遠(yuǎn),但看著Hinton打破這個(gè)領(lǐng)域的慣例,感覺非常棒!”(小小)