欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

搜狗王小川CNCC解讀:為什么搜索的未來是人工智能時代的明珠?

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  
10月20日,中國計算機大會(CNCC2016)在太原召開。 作為我國計算機領域規模最大、級別最高的學術會議,大會邀請了逾200位國內外計算機領域頂尖專家、企業家等參加 。上午壓軸出場的搜狗CEO王小川作為特邀嘉賓,發表了主題為《搜狗的人工智能之路》的演講,他指出“ 搜索的未來是人工智能時代的明珠;搜索未來將走向問答機器人,而輸入法也將向自動問答和智能回復發展。

搜狗王小川CNCC解讀:為什么搜索的未來是人工智能時代的明珠?

?
人工智能時代,搜索向問答機器人發展

搜狗王小川CNCC解讀:為什么搜索的未來是人工智能時代的明珠?

王小川認為,人工智能劃分為識別、生成和決策三大領域:“ 在學術領域中,識別與生成是同等重要的;而要讓人工智能產生市場價值,決策才是讓人工智能變成商業智能的核心。 ”在他看來,讓機器參與幫助人做決策提高效率,由此產生的商業價值才是最大的。
?
而搜索作為一種人工智能,其未來又在哪里呢?王小川說,“目前我們已經很好地解決了機器識別中語音和圖像的問題,但是在自然語言的處理中,我們目前還進展緩慢。今天機器仍不具有跟人交流的能力,因為它沒有概念。但是 在未來,搜索將走向問答機器人 。”
?
他舉例說:“正如觸摸屏正在逐漸代替鼠標鍵盤成為主要的機器操作方式,更自然的交互方式不僅更方便人們使用,也能為機器提供更多信息。隨著機器越來越聰明,搜索也會從簡單的依靠一個關鍵詞返回十條鏈接,轉向直接提供問題的答案。這種情況下真正有效的方式是通過自然語言問問題,形成更自然的人機交互。”他例舉了包括《星球大戰》、《星際穿越》《超能陸戰隊》等科幻電影中問答機器人的形象。 對于一問一答自然交互方式的研究,王小川表示,這不僅是搜狗的研究方向,谷歌、蘋果、亞馬遜等多家大公司也在做同樣的事情

?
輸入法的未來:自動問答和智能回復

搜狗王小川CNCC解讀:為什么搜索的未來是人工智能時代的明珠?

搜狗輸入法誕生于十年前,大數據、云輸入曾為之帶來快速發展,如今人工智能又為搜狗輸入法帶來了怎樣的變化?王小川以搜狗輸入法的語音識別技術舉例,“ 用戶可以直接使用語音輸入或者修改,這種更加自然的交互方式也推動語音技術高速發展。 ”據了解,目前搜狗輸入法日均語音請求接近1.8億次,用戶每天產生的語料規模超過13萬小時,遠超國內任何語音公司使用的語料規模。
?
最終,輸入法的未來將會走向自動問答和智能回復。 ”王小川表示,輸入法未來不再局限于簡單工具,借助于人工智能技術的發展與海量數據積累,除了可以與用戶做更加自然的交互,甚至還能幫助用戶做決策。他現場演示了搜狗輸入法的自動問答和智能回復功能:當用戶想要約朋友吃飯時,直接在輸入框輸入餐廳名稱,輸入法就能自主找到餐廳的相關信息,并能夠快速分享到對話中;如“你回公司了嗎”“文件什么時候發我”此類問題,輸入法甚至能夠直接提供備選答案,用戶直接點選就能快速回復,極大地提升了用戶表達和獲取信息的效率。
?

最后王小川總結道:“ 搜狗做的工作本身是讓表達和獲取信息更簡單 ,未來時代里,為了讓人機交互和自動問答做得更好,我認為有 兩個核心:一是自然交互,讓人與機器可以進行完整的對話。二是知識計算,為了實現自然交互 ,背后核心的是要在自然語言里對知識能夠建模,對知識能夠計算。 ”據悉,今年搜狗捐贈1.8億給清華,聯合成立天工研究院,將通過公開更多的數據,與高校間進行聯合研究,使搜狗搜索、搜狗輸入法在人機交互方面做出更大突破。


以下為演講全文:

今年大家提人工智能,搜狗公司也在做人工智能。有些媒體朋友說,“你們是要轉型做人工智能嗎?”我聽完覺得需要做一點解釋。因為作為一個做搜索的公司,本身對于技術的使用是蠻多的,不管是從大數據、云計算還是到今天的深度學習,武裝到牙齒的使用,本身我們的技術走多遠我們的業務就能走多遠。不同人對人工智能有不同的定義方法,我更多希望在技術之外從產品的角度理解人工智能有什么樣的價值,我把人工智能分為三個應用領域,這和廣泛的分類方法不一樣:一是識別,二是生成,三是決策。

這樣一個分法描述了今天主流發展中的突破點。比如從2012年ImageNet的發展上看,圖片的識別開始有了很大的提升。從這兩天微軟重磅的講語音識別已經真正超過了人,這是一個識別領域的進展。因此在學術領域,我覺得做決策、做識別和做生成都是同等重要的,我想給大家一個判斷,在這三個領域里,如果作為一個企業,把它變成市場價值,識別和生成本身很難背后有一個強的商業模式,而只有做決策才能變成商業智能里一個核心的過程,這是我想給大家分享的。

投資界有的時候說,誰做的圖片識別特別好,做個語音識別特別好,就暢想在未來有什么樣的價值,這是很危險的事情。所以我們看到很多做圖像和做語音識別的公司拿了很好的技術或成果推向市場后,并沒有找到很好的應用場景,或者做一個安防,并不能創造一些直接的價值,就把它給賣掉了,或者做一些簡單的to? B的 License fee,所以,這里面最重要的一點,是機器能夠幫助我們做決策,這個事情是三個里面的商業價值是最大的。

剛才我們提到有幾個明顯的概念,大家已經聽到爛熟。像大數據、云計算和人工智能。其實,我們做搜索、做輸入法都會用到這里面的核心技術,只是很難總結說這個事。簡單講搜狗這樣的狀態,我會進入下面對未來的思考。從搜狗現在而言,我們已經有巨大的用戶規模,我們的用戶規模在PC里是在中國排第一名的。在無線領域里,大家可能想不到搜狗輸入法APP這一款產品是在整個APP用戶規模里排第三,排第一第二的是微信和QQ。

為什么提這樣一些概念呢?是因為我們的用戶規模雖然大,但是輸入法本身不是一個做決策的機器。因為當用戶想輸入什么東西的時候它就會給你精確的結果。如果你輸入騰訊,它一定不會給你出阿里。你輸入淘寶不會給你出京東。對于輸入法而言,它是精確的把用戶的需求做一個翻譯的過程,所以它不是決策的機器,所以商業價值低。但搜索引擎不是,它本身是根據你的關鍵詞或概念后幫你做分析判斷。所以,PC上我們排第三名的位置,在無線里順利達到了第二,現在有36%的市場份額。

現在大家數互聯網上盈利的公司有多少呢?如果我們把游戲公司剖掉就知道有BAT、360、搜狗,再數出幾家盈利的公司都會很困難。我們在去年靠搜索引擎創造了1億多美金的利潤。因此,在今天的前提條件講完后,我想說明什么事?搜索本身是商業模式極好的互聯網應用,最近5月份出了百度這個事以后,一提搜索廣告大家就有負面的想法,其實廣告本身沒有錯誤,Google也在廣告上用得很好。所以,既要商業模式好又要快速盈利,這件事情是搜索重要的意義。

今天我想和大家分享的第一個觀點:搜索的未來就會成為人工智能未來的明珠,這是我的核心論點。所以,今天的搜索已經用了人工智能,未來也是核心,怎么理解這件事情?大家會問,搜索的未來是什么,人工智能的未來是什么,怎么就明珠了?我們以前講到AlphaGo是有一些智能,但它是偏專項的,而且是和自然語言沒有關系的。另外我們看到的圖靈測試是對智能方面的理解,今天我不給大家展開這樣一個概念,我更多想說,從難度上人工智能要解決三個事情:一是語音,二是圖像,三是自然語言的處理。哪個最難?我們以前發現發展的最早的是自然語言的處理,語音和圖像很長時間本身的處理很差,所以我們覺得自然語言簡單一些,特別是符號主義的情況下,覺得語音圖像更難。但最近幾年人工智能發展,我們很好的解決了語音和圖像的問題,它的識別率和生成能力得到了提高,但自然語言的處理發展的反而更慢。是因為我們看到,深度學習帶來的對一種感性的理解已經到了一個高度,但反過來由于自然語言本身中間對人的概念符號怎樣和深度學習結合是更難的事情。因此,這件事情的突破會比語音和圖像更難。

簡單講搜索的未來是什么?我先做一個簡單的回答,就是問答機器人。搜索未來是做問答的。怎么看這件事情?今天我們的搜索是從關鍵詞到10條的搜索結果。我曾經觀察過,在1999年到2000年的時候,搜索剛剛誕生,這個時候大家用搜索的用法不是輸入關鍵詞的,我當時在chinaRen曾經做了一個孫悟空搜索之后,我找了第一個用戶來用,我說這是一個搜索引擎,你試著在這上面提問。他問的第一個問題,“我今天美嗎?”我立刻就覺得很崩潰。在我心中已經覺得它是一個檢索的系統。所以,經過好多年的教育后,今天的用戶已經懂得了用關鍵詞來尋找他需要的答案。有一個數據統計,關鍵詞之外大家會加空格把它變成一個符合的搜索,單關鍵詞的搜索量占整個搜索的97%,只有3%的搜索是在關鍵詞間加了空格,所以在座的各位可能更多是這種高知群體,我們不管對搜索技術有多么理解,但是我們自己已經懂得怎樣去描述自己的這樣一個表達,用關鍵詞+空格的形式來翻譯自己的想法獲得答案。

但這個系統在今天夠好嗎?還有什么改進空間嗎?我和一些朋友聊的時候,他們也提到說,我們能不能把它做得更個性化,通過個性化能夠使搜索品質獲得提升?我說這個答案其實是不對的。第一,搜索引擎本身通過關鍵詞輸入就隱含了個性化的因素。以前個性化是首先分男女,但你看關鍵詞在很大層面上就能看出男女來,當你查一個包包品牌的時候更有可能是女性,當你查一個足球運動的時候更有可能是男性。所以,用搜索引擎的時候個性化對它的幫助是有限的。更重要的一件事情是,即便有了個性化,我并不認為我們就能夠知道用戶在表達什么。

如果今天大家好奇,你問一個詞,問搜索引擎王小川?那搜索引擎能夠給你什么答案呢?或者你問我本人“王小川”這三個字,其實我不知道你要什么,即便我和你再熟悉,我也不知道你的判斷,我只能告訴你,把我的百科給你,把我的新聞給你,把我最新的一些活動的事情給到你,因為我不知道你想要什么。或者你問搜狗,我最多再把官網給你。這是因為通過一個關鍵詞的檢索,里面的信息量損失是非常大的。我只能通過給你更多的結果試圖來測測你想要什么,因此整個系統的改進空間不是在個性化或者是在精準算法上就能得到的,這件事也是因為我們的輸入就是一個具體的詞不夠。

也有說我們改進的時候是不是通過語音搜索能夠更好?最近語音發展得很快,在資本市場開始提語音,這其實也是一個錯誤的理解。如果用文字輸入王小川三個字或者用語音輸入王小川三個字本質上差不多,最多語音輸入帶一個口音,一聽你是四川人,能夠知道是我的老鄉,給你的結果能夠不一樣一點,但其實本質上是沒有一個明顯的進步的。
?
真正的進步在哪里?我給大家舉個例子。這個例子我們是在向喬布斯致敬,以前我們懂得用鼠標和機器做交互,覺得很方便。但做手機的時候,當喬布斯拿出第一款iPhone的時候,也不需要鼠標,也不需要筆,他強調的就是用你的幾個手指來和機器進行互動。所以,走向了一個更自然的交互的方式。iPhone這樣一種交互已經形成了行業中一種風潮,包括iPad,大家都懂得用手做交互,甚至一個三歲的小孩都能學會。我曾經見一個案例,一個三歲的小孩子走到電視機面前,就像用iPad一樣用手劃電視機的屏幕想去換臺,大家知道會失敗,所以他說,“媽媽,我們的電視機壞了”。這時候大家就知道自然交互能夠帶來多大的魔力,使得三歲的小孩子都能夠學會,這就是和物理世界和自然世界更相關的模式。在這種情況下,我們認為搜索未來的方向會走向提問,它的核心問題不是語音,也許語音提問是最方便的,而是讓人用最自然的方式能夠和機器做交互。所以兩層含義達到了:第一件事情是我們的人更加自然,第二件事是機器也獲得更多的信息,幫助它做判斷。你可以問,王小川你今年多大了,你這個問題提出后,機器就會有一個明確的答案,否則要我猜你,即便我是你肚子里的蛔蟲,我也不知道你要什么。

因此今天搜索的趨勢就從問題走向更精確的回答。這里是怎樣的思考?在很多年來,如果你不用問題,只用詞我沒有辦法給你好的答案,因為我不知道你要什么。但即便你提問題,對不起,以今天的人類技術依然沒法給你好的答案,因為機器聽不懂,不知道你在說什么。這件事情使得機器本身的這樣一個技術的瓶頸把我們推向了左面的關鍵詞到十個結果這樣一個路徑。我們已經看到了一個苗頭,隨著對自然語言處理開始加強,我們從NLP走向NLU,我們開始有機會做問答。所以google也在講,未來的搜索引擎70%的搜索是會直接給答案,其實它潛藏了一個概念,70%的搜索用戶是在提問題。因此在這個領域里,我們可以看到各家公司已經扎進去了,最早進去的是Siri,之后是微軟的Cortana,然后是亞馬遜的Echo,最后還有google推的Assistant這樣的系統。所以,我們好奇一件事,為什么不是Google第一個推這個系統,因為我們剛才的理解力,Google離這件事情是最近的,而變成了蘋果在做。我在里面的思考是兩種可能性:一種原因是因為蘋果公司的技術基因不夠,所以它以為這件事情是更快達到效果所以搶這樣一個產品的發布,在發布后其實蠻被動的。蘋果在發布后,不斷的收購自然語音特別是做問答、做對話的這些公司,比如像英國劍橋的公司,一個叫做VoiceIQ的東西蘋果就收了,收了以后發現這些人迅速的離職,離職后再創一個公司,又做自然語言處理,蘋果又收進來,不斷的迭代的過程,因為它今天的技術還沒有解決好。第二種原因,我理解是蘋果知道自己的技術不夠,但喬布斯有他的這樣一個愿望,是在他的有生之年能夠把這種終極的人機交互模式給推出來。我們大家記得Siri是什么時候發布的嗎?是在蘋果的iPhone? 4S發布的,喬布斯是躺在病床上看現場的直播,他已經沒有能力發布這款產品,這個產品發布后的幾天他就過世了。所以在我內心的另外一個感受這是他的遺愿,他知道我們發明了手機,我們開始懂得了用手指交互后,下一個人類最重大的事情是用語言的方式去提問,去命令這樣一臺機器。所以,由于自己的時間已經不長了,提前早產把這樣一個產品發布向市面,所以我想這是對問答機器背后重要性的理解。

事實上我們在若干的科幻作品里都會看到我們在科幻里面最極致的對技術理解,就是在做問答的機器。從《星球大戰》里的機器人,再到《超能陸戰隊》里的大白,再到《星際穿越》里的機器,里面都強調一個很聰明的機器,人類幻想中無外乎是這樣的智慧。還有一本書我很喜歡,是阿西莫夫寫的,他寫了很多經典的小說,包括《基地三部曲》。他有一篇超短篇的小說《最后的問題》,這個問題描述的是人類竭盡所有的技術潛力去制造一臺能回答問題的機器,當我們是一個國家的時候我們集國家的力量造這臺機器,當人類已經把地球統一了之后,集地球的力量造這臺機器,通過光纖做連接,給它輸入大量的能源,把人類全部的知識給輸入進去,當我們控制了銀河系之后,我們把銀河系的能力用來造這臺問答機,當人類控制整個宇宙的時候造一臺宇宙的機器,甚至人類已經把宇宙機器送到異次元的空間里,讓它不斷的做回答。

這個故事的精妙之處是這臺機器一直有一個問題它回答不了,那就是宇宙會怎么毀滅和重新起源。因為大家知道,如果宇宙能量會守恒,熵值會單增,最多會陷入宇宙的無序,無序后宇宙怎樣重新誕生。這個機器一直回答不了這個問題,不管是地球的機器還是銀河系的機器,還是宇宙的機器都回答不了這個問題。這個機器都一直說,對不起,這個問題我不知道答案。到最后整個人類把整個宇宙的資源都消耗掉后滅亡了,這個機器還在宇宙的異次元空間中運轉,有一天這個機器突然說,我找到答案了,我知道宇宙是怎么毀滅和怎么誕生的,然后他說了三個字,“要有光”,就講到《圣經》的起源,怎么創造宇宙。所以,這個故事,我想強調的一個核心要點,就是人類對于未來幻想里面最重大的一件事情就是制造一個能回答問題的機器。今天在這個領域里,我依然堅信,以Google為代表的搜索引擎會走在最前面。因為從創新者窘境的角度談,搜索引擎本質工作就是在解決用戶提問題,它能夠給你提供信息和答案的這樣一個商業模式。所以,我不能指望蘋果和其他公司在這里面有一個超越,因為只要技術走多遠,搜索引擎就會發展到多高,這是我想給大家講到人工智能未來的發展和搜索未來的發展之間,是在問答領域里會有重新的合體,這也是我們努力的一個方向。

搜狗本身在做這個使命的時候,一直以來,就定義的是讓表達和獲取信息更簡單。獲取信息是我們講的搜索引擎,表達是我們提到的這樣一個輸入法。輸入法未來有什么樣的發展空間呢?其實輸入法本身也同樣是大數據、云計算、人工智能的產物。搜狗輸入法是2006年誕生的,我們先做搜索后做輸入法。輸入法一面市的時候就比同時代的輸入法有巨大的跨越,本質原因就是我們利用輸入法,把整個互聯網上的中文網頁都做了檢索,在里面把詞的詞頻和詞的句法關系做了統計分析。所以,當時問我們這個原理的時候,我們說把整個互聯網作為我們的數據庫來做輸入法。到后來我們提到了一個更簡單的詞,今天這個詞可能已經過時——就是大數據。其實輸入法本身是一個大數據的產物,用搜狗輸入法的人在PC、手機里都會看到一個特點,有的時候如果輸詞,結果結果執行度不高,會突然出現一個新的結果,上面畫了一個小云的標記,這就是用的云計算。因為輸入法本身在本地我們只用了80兆的存儲量,大概裝了40萬個詞,這是經過計算后,在詞庫大小和性能中做的平衡。如果本機解決不好的時候,我們有執行度,如果本機的詞頻不夠滿意,這時候就會把輸入的拼音串提交到服務器上,服務器的存儲量和計算能力是單個PC的幾十倍上百倍,在這個平臺里面能夠用更復雜的語言模型給你提供更好的結果,這是云計算的產物。

今天我們講到人工智能也是給搜狗這樣的機會。但用輸入法的時候,我們提供兩個能力,也是最近三年來有高速的發展。一是語音識別。所以用我們輸入法的時候,前兩天在錘子的發布會上(錘子)和訊飛有一個合作,談到用語音,現在是一個主流的輸入方法。我們在這里面從2011年到現在也做了五年的時間,也很簡單,我們在這里面有幾個得天獨厚的條件:有最大的數據資源和最多用戶的使用,再加上把領先的算法移植到這個程序里去。今天搜狗輸入法的語音識別量能夠到一天是1.8億次語音識別,還在慢慢的上升。一天語音識別用戶輸入的小時數,是在57到58萬個小時之間,一天用戶的輸入這樣一個數據量就比我們現在全中國所有公司用來做語音識別標注的這樣一個數據的時長都還要長。所以,搜狗在這個過程中攢了最多的用戶需求和最好的這樣一個數據的資源,理所當然,我們就能把這樣一個服務推到一個高處去。

另外一個功能大家用的比較少的是OCR,我們講的是圖像處理。你拍一段文字,不管中文還是英文的,一掃描就能作為一個輸入的源頭。所以當我們問搜狗輸入法未來的發展方向,大家容易去想,往下怎么走,語音輸入和圖像輸入,包括我們內部也有系統拍一張照片就能做caption把它的標題取出來,我們在行業里做研究的時候看到了這樣一些生成文字的方法,但是我想告訴大家,語音輸入和圖像輸入都不是我心中認為輸入法最核心的發展方向。
這個是視頻里的一張圖片,如果當你看一個圖片,你的女朋友發一個圖片給你,問,好看嗎?你怎么回復,你會回復說,這個飛鳥還有夕陽真是太好看了,這個在撩妹上效果就不太好。所以你如果能夠發給她一段詩詞,大家會覺得你特別有文采。所以,在輸入法里面,我們真正讓它對語言有更多的了解,而不是在拼音或者走語音的方法在做輸入,這是我們在理念上的進展。
?
我們做的工作本身是讓表達和獲取信息更簡單,未來時代里,為了實現讓人機交互和自動問答做得更好,我們認為有兩件核心的事:一件事情是自然交互,剛才我們提到了,完整的對話的語言溝通,這是我們和機器打交道終極的理想,喬布斯有他的遺愿在,我們一起去實現這件事情。另外為了實現自然交互,背后核心的是要在自然語言里對知識能夠建模,對知識能夠計算,這是我想提到我們在做搜索和做輸入法里面,給研究界提供的數據和研究的一個課題。因此,今年我們和清華成立的天工研究院,核心是要公開更多的數據,今年內我們要開始開放一些語音、圖像和文字的數據,能夠和高校形成更好的聯合研究,使得我們從搜索、輸入法走向一個人機互動的未來,也特別希望未來跟各位學術界的同仁們有更好的合作,互相的支持。


搜狗王小川CNCC解讀:為什么搜索的未來是人工智能時代的明珠?

wwwgx2016 互聯網觀察

搜狗王小川CNCC解讀:為什么搜索的未來是人工智能時代的明珠?
長按,識別二維碼,加關

本文被轉載1次

首發媒體 互聯網觀察 | 轉發媒體

隨意打賞

搜狗ceo王小川王小川 人工智能搜狗學術搜索搜狗搜索引擎搜狗微信搜索搜狗王小川
提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 狠狠久久亚洲欧美专区 | 日本一级毛片毛片一级毛片 | 在线免费一区二区 | 普通话对白国产情侣自啪 | 欧美性猛交ⅹxxx乱大交免费 | 久久久久久极精品久久久 | 色婷婷色 | 99热国产这里只有精品免费 | 一级毛片 在线播放 | 性xxxx奶大欧美高清 | 久99久精品免费视频热77 | 特级片毛片 | 一级一级一级毛片免费毛片 | 日本免费一区二区三区在线看 | 久久久精彩视频 | 国产婷婷色一区二区三区 | 亚洲a毛片 | 中文字幕亚洲一区二区三区 | 国内精品久久久久影院日本 | 男人的天堂免费在线观看 | 九九国产在线 | 99re热久久资源最新获取 | 97国产在线公开免费观看 | 一级毛片不卡 | 国产伦精品一区二区三区免 | 亚洲狠狠色丁香婷婷综合 | 国产网站免费视频 | 国产人伦视频在线观看 | 九九99香蕉在线视频网站 | 亚洲91| 福利免费观看 | 九九精品视频在线观看九九 | h片在线观看| 久久久免费网站 | 国产免费69成人精品视频 | 久久精品国产精品亚洲人人 | 精品国产96亚洲一区二区三区 | 国产综合色香蕉精品五月婷 | 午夜在线社区视频 | 久久精品国产福利国产秒 | 久久国产免费观看 |