一篇文章分辨人工智能、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)

人工智能 ? 機(jī)器學(xué)習(xí) ? 深度學(xué)習(xí) ?安全界用辭令人困惑,了解主要用語(yǔ)真正的意義,方可在信息安全的世界中游走自如。
在熱情的市場(chǎng)營(yíng)銷人員口中,“人工智能”、“機(jī)器學(xué)習(xí)” 和 “深度學(xué)習(xí)” 的定義變得模糊,明確性讓位于增加銷量的需要。客戶完全有可能遇到貼著多個(gè)此類標(biāo)簽,卻幾乎不具備這些特性的產(chǎn)品或服務(wù)。
機(jī)器智能的話題常會(huì)落入其獨(dú)特的術(shù)語(yǔ)和專業(yè)概念無(wú)底洞。這些術(shù)語(yǔ)將構(gòu)成未來(lái)安全基礎(chǔ)設(shè)施中的重要部分,其間區(qū)別真的重要嗎?
三個(gè)分支
總的說(shuō)來(lái),機(jī)器 “智能” 就是一套系統(tǒng),攝入數(shù)據(jù),產(chǎn)出結(jié)果,并且隨著數(shù)據(jù)攝入量的增加而不斷變得更好、更快。 整個(gè)機(jī)器 “智能” 大類下有三個(gè)標(biāo)簽常被貼到系統(tǒng)上:機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和人工智能 。每一種都有其獨(dú)有的數(shù)據(jù)處理方式和結(jié)果呈現(xiàn)方式。
這三種方式在運(yùn)行機(jī)制上的差異使得它們分別適用于不同的任務(wù)。而其間最為突出的差別存在于人工智能 ( AI ) 和其他兩種之間。簡(jiǎn)單講,AI 的結(jié)果能令你震驚,而其他兩種則“只”能讓你驚異于其速度和準(zhǔn)確性。
機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)采用靜態(tài)模型(營(yíng)銷人員口中的 “啟發(fā)式方法”)而非僵化的算法編程來(lái)獲得結(jié)果。從稍微不同的角度觀察,機(jī)器學(xué)習(xí)可以運(yùn)用大量輸入來(lái)獲得特定的結(jié)果集。
市面上很多技術(shù)都可以歸到機(jī)器學(xué)習(xí)上來(lái)。比如監(jiān)督和非監(jiān)督式學(xué)習(xí)、異常檢測(cè),以及關(guān)聯(lián)規(guī)則。以上幾種技術(shù)中,機(jī)器學(xué)習(xí)都可以從中輸入新的學(xué)習(xí)樣本,讓其作為動(dòng)作依據(jù)的算法模型更加豐富、全面、準(zhǔn)確。
所以,關(guān)鍵就在于 “特定結(jié)果集”。比如說(shuō),如果你想讓機(jī)器學(xué)習(xí)系統(tǒng)分辨貓和狗,你可以教它各種用于定義貓和狗的參數(shù)。越多數(shù)據(jù)用于構(gòu)建模型,該系統(tǒng)就越能準(zhǔn)確區(qū)分貓和狗,最終能夠基于耳朵或尾巴分辨目標(biāo)對(duì)象是貓還是狗。但即使你拿出的是一只鵝,該系統(tǒng)也會(huì)告訴你是一條狗還是一只貓,因?yàn)榕袛嘟Y(jié)果就只有這兩種選擇。
如果目標(biāo)是分類多種輸入,或者指示要采取的特定動(dòng)作以完成自動(dòng)化過(guò)程,那么機(jī)器學(xué)習(xí)就是非常合適的一種技術(shù)。
深度學(xué)習(xí)
深度學(xué)習(xí)歸屬機(jī)器學(xué)習(xí)范疇,但是其中尤為特別的一類。“深度學(xué)習(xí)” 表明神經(jīng)網(wǎng)絡(luò)屬于處理技術(shù)大家族。盡管神經(jīng)網(wǎng)絡(luò)面世已久,但最近十年的發(fā)展才令該技術(shù)更貼近應(yīng)用開(kāi)發(fā)人員。
如今的神經(jīng)網(wǎng)絡(luò)基本上采用層次化技術(shù)在多個(gè)處理層間傳遞輸入。這是神經(jīng)網(wǎng)絡(luò)模擬動(dòng)物智能的一種方式。這種擬態(tài)使深度學(xué)習(xí)適用于為數(shù)不少的一系列應(yīng)用。
安全之外的語(yǔ)音識(shí)別和圖像識(shí)別應(yīng)用就常建立在深度學(xué)習(xí)技術(shù)之上。而在安全領(lǐng)域,深度學(xué)習(xí)常見(jiàn)于惡意軟件檢測(cè)和威脅檢測(cè)系統(tǒng)。因?yàn)樯窠?jīng)網(wǎng)絡(luò)節(jié)點(diǎn)間的連接數(shù)量(從幾百個(gè)到數(shù)百萬(wàn)個(gè)不等),學(xué)習(xí)和處理主要發(fā)生在中央云系統(tǒng),而學(xué)習(xí)結(jié)果應(yīng)用在網(wǎng)絡(luò)邊界的那類應(yīng)用,常會(huì)用到深度學(xué)習(xí)技術(shù)。
沿用前文中舉的貓狗分辨例子,深度學(xué)習(xí)也能夠?qū)W習(xí)如何分辨貓和狗,經(jīng)訓(xùn)練后能判斷狗和貓的品系,甚至能達(dá)到根據(jù)外貌特征給雜種狗指派可能品系的程度。但,深度學(xué)習(xí)仍然只局限在分辨貓狗上,可憐的大鵝依然不存在于深度學(xué)習(xí)的結(jié)果集中。
人工智能
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)系統(tǒng)都是不斷攝入大量數(shù)據(jù),返回特定參數(shù)集范圍內(nèi)的結(jié)果。所以,這兩種技術(shù)便于集成到自動(dòng)化系統(tǒng)中。人工智能則不然,其得出的結(jié)論可能超出定義的參數(shù)。人工智能拿出的結(jié)果會(huì)令你驚訝。
若咨詢學(xué)術(shù)界 AI 研究員,他們會(huì)說(shuō)市面上的 AI 都不“真” AI。他們的意思其實(shí)是當(dāng)前不存在通用 AI ——《太空漫游 2001》里 HAL 9000 那種人工智能電腦。
但是,可針對(duì)特定問(wèn)題應(yīng)用先進(jìn)智能的 AI 系統(tǒng)是存在的。IBM 的 Watson 就是其中最為知名的,但還有其他很多特定于應(yīng)用的 AI 引擎為各供應(yīng)商所用。“深度偽造” (deep fake) 音視頻引發(fā)的廣泛擔(dān)憂,也是不同應(yīng)用和服務(wù)中所用 AI 功能催生的。機(jī)器人,包括自動(dòng)駕駛汽車,則是另一個(gè)例子。
AI 系統(tǒng)應(yīng)能納入深度學(xué)習(xí)中建立的所有模型信息并加以延伸。再給多一點(diǎn)信息,AI 系統(tǒng)還可能分辨新圖像是哺乳動(dòng)物還是其他種類的動(dòng)物,即便呈現(xiàn)在眼前的是消防栓的圖片,AI 系統(tǒng)也能告訴人類操作員這是從未見(jiàn)過(guò)的新 “動(dòng)物”,需要更多學(xué)習(xí)。AI 的結(jié)果可能跳出給定的結(jié)果集。
網(wǎng)絡(luò)安全領(lǐng)域里,分析師用 AI 幫助篩選和分類每天涌入安全運(yùn)營(yíng)中心 (SOC) 的大量輸入數(shù)據(jù)。需要指出的是,現(xiàn)今非預(yù)期結(jié)果出現(xiàn)的可能性意味著,AI 是用來(lái)輔助或增強(qiáng)人類分析師的,不僅僅用于驅(qū)動(dòng)安全自動(dòng)化。
天網(wǎng)預(yù)備役
面對(duì)以上幾種機(jī)器智能,操作人員必須警惕兩大問(wèn)題,其中一個(gè)問(wèn)題由內(nèi)部力量驅(qū)動(dòng),另一個(gè)問(wèn)題則受外因推動(dòng)。內(nèi)部問(wèn)題是所謂的 “模型偏好”——系統(tǒng)模型中用于學(xué)習(xí)的數(shù)據(jù)會(huì)使模型偏向特定分析方向,而不是由系統(tǒng)自然得出數(shù)理上正確的答案。
外部問(wèn)題則源自 “模型中毒”,也就是有外部因素確保模型得出不正確的結(jié)果。取決于應(yīng)用,中毒可導(dǎo)致令人尷尬或?yàn)?zāi)難性的結(jié)果,IT 或安全人員必須警惕這種可能性。
由億歐公司主辦、粵港澳大灣區(qū)研究院(廣外)聯(lián)合主辦的“2019大灣區(qū)國(guó)際科創(chuàng)峰會(huì)(BATi)”結(jié)合灣區(qū)科創(chuàng)和青年特色優(yōu)勢(shì),將第二屆大灣區(qū)國(guó)際科創(chuàng)峰會(huì)的主題定位于“科技賦能、青年引領(lǐng)”,將圍繞5G生態(tài)、硬件創(chuàng)新、工業(yè)數(shù)字化、AI企服、科技出海等熱點(diǎn)展開(kāi)探討,歡迎科技創(chuàng)新的觀察者參與!
報(bào)名鏈接: https://www.iyiou.com/post/ad/id/875
本文已標(biāo)注來(lái)源和出處,版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們。