關于智能眼鏡,你不知道的那些冷知識(二):核心篇

本文作者:本文作者艾韜,易瞳科技 CTO,畢業于多倫多大學計算機工程專業,多年跟隨 “世界穿戴電腦之父” Steve Mann 教授,專注于智能眼鏡的基礎研究,爾后歸國創業獲得導師 Steve Mann 和其實驗室全力支持。公司郵箱:info@visionertech.com。本文首發于易瞳科技微信公眾號,授權 36 氪轉載。查看本系列文章 點這里 。
剛才把這篇文章發給陳東義老師(中國最早研究穿戴電腦的頂尖學者,上海樂相科技創始人陳朝陽的導師)。他覺得文章中 Humanistic Intelligence 的中文釋義可作人文智能(或人本智能)。陳老師還跟我說 “很有必要普及 Mann 的概念,目前 Wearable 這個領域沒有超越 Mann 理念的。現在的很多觀點,都沒有超越,還落后。Mann 的理念是可穿戴的核心,是未來的方向。”
前不久,一篇 AI 下圍棋的新聞炒得沸沸揚揚,圍棋 AI 在人類歷史上第一次戰勝職業選手。然而,就像當年被 “深藍” 打敗的國際象棋大師 Garry 所說的那樣,這并不意味著電腦在象棋領域取代了人類。不僅僅是下棋,AI 再聰明,它也取代不了人。我相信,最終取代人腦的不是電腦,而是 “人腦 + 電腦” 。未來的象棋或圍棋大師,不是人也不是電腦,而是最會用電腦分析棋局的人。一個相信計算機,并且能和計算機兼容的人,叫 Cyborg(賽博格)。這個人機共生體,實現的不是 AI,而是 HI。
上一次在概念篇中跟大家探討了智能眼鏡中的一些概念,基本上覆蓋了所有智能眼鏡的形態,也就是大家正在做的是什么。但我覺得,比 “做什么(What)” 和 “怎么做(How)” 更重要的是 “為什么(Why)”。這是一個框架,也代表了一個愿景。更重要的,這是一個核心。
所以,今天要給大家介紹的東西叫 Humanistic Intelligence (HI),由穿戴電腦之父 Steve Mann 教授于上世紀 90年 代提出。在電子科大 陳東義 老師(國內最早研究穿戴電腦的學者)的筆下,HI 的中文翻譯是 “ 人文智能 ”。HI 凝聚了上世紀頂尖學者的心血,在過去的 30 多年里,智能眼鏡的發展方向是以 HI 為指導思想的。而實現 HI 中的 “人機共生”,就是我們做智能眼鏡的初心。
前年底當我快要離開實驗室的時候,實驗室的名稱已經從之前的 “EyeTap Personal Imaging Lab(ePI Lab)” 改成 “HI Lab” 了。去年底,回實驗室拜訪教授時,他讓我在實驗室的宣傳視頻中向多倫多大學的新生們介紹一下我對 HI 的理解。所以,在我向你們扔出密密麻麻的文字之前,可以先看一看下面這段小視頻( 視頻地址 )。在介紹從實驗室走出來的各個黑科技創業公司的同時,我也把我心目中所理解的 HI 給大家簡單地說了一下。視頻中的翻譯字幕,我放在文末尾,不想看視頻的去看字吧。
好啦,言歸正傳。傳統意義上的 “人機交互(HCI)” 把人和計算機分開成兩個孤立的個體,它們通過各種 I/O 進行通訊,從而傳達信息。鼠標,鍵盤,耳機和觸屏都是我們熟悉的交互方式。然而,由 HI 所提出的 “人機共生” 把計算機和人當作一個整體。在這個體系中,計算機是人的第二個大腦,輔助佩戴者工作的同時,在使用者的指導下學習并改變著這個世界。所以,就像視頻中提到的那樣, 你覺得自己在玩兒計算機,其實計算機也在玩兒你。
接下來,我會跟大家簡單討論一篇論文的內容。這是 98年IEEE 期刊的封面文章,比較系統地闡述了 HI 的各個方面,同時也對 HI 如何指導智能眼鏡的研發有一個很明確的敘述。由于我水平有限,需要注意的是,以下內容是一個小工程師對一個大師思想的反芻倒嚼。是我進食后經過一段時間從肚子里吐出來的半消化物。大家品嘗的時候要注意,大神們請從文末鏈接直接下原文。
HI 描述的是零距離的人機關系,所以 HI 的實現就需要人與機的緊密結合,而所有人機交互中,智能眼鏡可以把需要傳達的信息量實現到最大化。從大方向說,實現 HI 所需的系統有三種運行模式:
第一,Constancy(恒定模式)。這個系統必須恒定持續地運行(Operationally Constant,OC),它偶爾會進入睡眠狀態,但它不應該完全斷電。現在大家用手機時就可以深切感受到 OC 的重要性。沒電的手機就失去了 OC,令人崩潰。另外,這個系統必須恒定持續地可交互(Interactionally Constant,IC)。也就是說,它隨時處于待命狀態。從這個意義上來說,IC 就意味著 OC,但 OC 不一定代表 IC。讀到這里,Apple 為什么要多出一個 iWatch 的原因就很清楚了。手機在兜里,雖然持續運行,但不可持續交互,所以沒有實現 IC;為了縮短 “交互距離”,手機就需要多一塊表。通常人們不一定能意識到恒定模式的重要性,所以大多數電子設備的 “交互距離” 是很大的。作為 HI 的最基本的運行模式,恒定模式是實現智能眼鏡的第一步。有恒定模式的人機交互如下圖所示,人與機互相通訊,共同作業。
第二,Augmentation(增強模式)。傳統的人機交互的觀點通常把計算(Computation)本身作為最主要的任務。然而,HI 的觀點是把計算融入更重要的人的任務中去。實現增強模式的應用有一個特點,就是人在用計算機的同時,還在做一件別的事情。而通常來說,這件對于計算機來說的 “別的事情” 才是這個人機共同體的主要任務。例如某人在用導航的時候,首先他要開車要看路,他不能總是盯著屏,所以路徑圖要在視線范圍內的一個方便的位置并加上語音輔助;其次計算機給出的所謂最短路徑并不是唯一方案。某人(我不會開車,所以不是我)要去接個女性朋友,他就不會考慮最初給予的最短路徑而希望系統持續更新并重新規劃路徑,實現了增強模式的系統示意。如下圖,人可以同時接受來自物理世界(真實環境)和數字世界(虛擬圖像)的信息,并同時和兩個世界進行交互。
第三,Mediation(介導模式)。當上述兩個模式可以被某種系統實現之后,這個系統可以通過介導模式將人機更緊密的結合起來。這個時候,計算機的輸入和輸出就和人的感知和運動無縫地連接在一起了。實際上,我們說介導模式就是計算機對人的一種封裝。拿智能眼鏡舉例子,有增強模式的智能眼鏡可以讓佩戴者同時看到自然光和數字光,而有介導模式的智能眼鏡先通過傳感器采集自然光,并對這些數字化過后的光做出需要的調整,最后把這些數字化的光通過設備重新還原出來。這樣佩戴者會感覺到他看到的世界以一種新的方式呈現出來。然而,現實是沒有變的,被改變的只是佩戴者的感官。如下圖,這種封裝既能使人從現實中脫離出去,又能使人以更強的感官去感受現實。從這個意義上來說,介導模式增強了人的能力。
綜上所述,HI 的三個模式是可以并存于一個系統之內的。對于人來說,聽覺和視覺信號是可以數字化的信號。而視覺信息所能傳遞的信息量比聽覺要大很多。因此,計算機的交互發展會以視覺為主導。在智能眼鏡當中的概念(VR,AR,和 MR),即虛擬現實,增強現實和介導現實的實現也必須以上述三個模式來運行。如下圖,結合三個模式并可以相互轉換的話,我們就有了一個完整的 HI 示意圖。
當然,既然是科普,有些東西不會講的特別細。系統運行當中的六個基本信號流程及其作用本質我這里就不多做說明了。能讀到這里感覺味道還不錯的同學我建議你們去下載教授的原文,原文中會對下圖所示的完整 HI 進行詳細的闡述。
最后,附上原文鏈接和視頻字幕:
http://www.eyetap.org/papers/docs/HumanisticComputing_Mann1998_ProcIEEE.pdf
HI 代表的是 Humanistic Intelligence,
它是我們實驗室里進行各種工作的指導思想。
大家經常問我對人工智能的看法,
人工智能確實酷,但同時,它是冰冷的。
對我來說:HI 是有心靈的人工智能,
它是為了改良一個物種,
而非創造一個新的物種。
在 HI 反饋環里,
人和計算機實質上是一個整體。
我們在研究穿戴電腦的時候,
遵循的是人機共生的思想。
你覺得自己在玩計算機,
其實計算機也在玩你。
過去我們一直想培養具有 STEM 素養的人才,
也就是科學,技術,工程和數學,
但這種理念漏掉了對心靈的培養。
教授 Steve 提出 DAST,
認為全面教育應該包括:
設計,藝術,科學和技術。
所以我們相信:在 HI 實驗里,
優秀的學生不僅僅要寫出沒有 BUG 的軟件,
或做出高速運算的硬件。
我們希望你嘗試
去找到真心喜歡和特別擅長的契合點。
我覺得對你來說,
這個點才能讓你成為一個走心的工程師。
本文來自讀者投稿,不代表 36氪 立場,如若轉載,請注明出處:http://36kr.com/p/5043813.html
“看完這篇還不夠?如果你也在創業,并且希望自己的項目被報道,請 戳這里 告訴我們!”