欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

財報發(fā)布后,搜狗王小川談了談百度、人工智能和上市

我是創(chuàng)始人李巖:很抱歉!給自己產(chǎn)品做個廣告,點擊進來看看。  

財報發(fā)布后,搜狗王小川談了談百度、人工智能和上市

王小川

昨天下午看到王小川時,第一個感覺是他變得更清秀了。 一位接近搜狗的人士告訴我,王小川在這幾個月內(nèi)“瘦了十幾斤”。

昨天剛出的搜狐財報,在廣告業(yè)務(wù)、在線游戲的一片虧損中,只有搜狗還在堅挺著相對平穩(wěn)的增長趨勢。 2016年全年,搜狗營收44億元人民幣,同比增長19%,非美國會計準則下的凈利潤達6.4億元人民幣,根據(jù)最新匯率約合9300萬美元,相比2015年1億美元凈利潤,同比下滑7%。其中,2016年第四季度,搜狗營收11.7億元人民幣,同比增長11%。

去年中國的搜索市場上風(fēng)波不斷?!拔簞t西事件”后,對于搜索引擎內(nèi)容推廣是否應(yīng)定性為廣告的爭議引起了廣泛討論?!痘ヂ?lián)網(wǎng)廣告管理暫行辦法》的出臺不僅規(guī)范了搜索廣告的定義,也對搜狗的利潤造成了一定的影響。這是本季度有點下滑的主要原因。但王小川對下個季度的財報保持樂觀的態(tài)度,認為會有一定的增長。

今年年初,微軟“華人第一高管”陸奇空降百度,百度人工智能“小度”參加電視節(jié)目《最強大腦》也吸引了不少人的目光。與此同時,搜狗的人工智能“汪仔”也開始亮相在公眾視野當中,第一站也是一個與人類爭鋒的電視節(jié)目——《一站到底》。

同處于搜索行業(yè),王小川如何看待現(xiàn)在的百度與搜狗的區(qū)別?百度將人工智能定為核心戰(zhàn)略,搜狗又達到了什么樣的成就?推出英文搜索后,搜狗怎么進一步尋求搜索份額的突破?這些都成為了亟待王小川解答的疑問。

以下是搜狗CEO王小川與搜狗首席科學(xué)家許靜芳在記者溝通會上的全文速記,我們疏通了一下文字,劃了重點:

王小川:挺高興有機會和大家面對面談,有段時間我們和媒體沒有親密的接受任何一個這樣的訪問。回顧從2013年到2016年,13年搜狗與搜搜合并,到現(xiàn)在已經(jīng)三年的時間。

我第一個感慨是,搜狗搜索活下來了 ,2013年合并時,360的一些言論,說中國搜索市場只能容納兩家,沒有第三家的事情,表達第二家是他,現(xiàn)在看起來,在中國百度依然還是很大,此外搜狗是唯一一家既有PC搜索也有無線搜索,市場份額、收入利潤在上升的公司。這也是我們活下來,而且不斷地有更多競爭力的原因。2016年利潤是6.4億人民幣,其中投入到很多領(lǐng)域去,在搜索行業(yè)算是活下來的。

具體看量,我們可以號稱叫全球第三大搜索引擎 ,雖然只做中國市場,因為Google最大,百度第二,我們第三,從搜索量排是在第四,后面才是其他家引擎,想說量上中國市場是最大的,在國內(nèi)第二,在全球排第三的位置。

2015年,我們發(fā)布了微信搜索和知乎搜索,2016年,我們發(fā)布了明醫(yī)搜索和英文搜索,慢慢開始和百度走向不同的道路。大家用微信會用一些。 我認為,醫(yī)療搜索和英文搜索是通向未來兩個很重要,可以展開無限想象力的事情 ,通過微信搜索和知乎搜索基本固定了形態(tài),在醫(yī)療往下出現(xiàn)自助診斷甚至分診,能夠讓用戶真正明明白白看醫(yī)生?,F(xiàn)在大家拿著化驗單可能不知道什么意思,給你個診斷方向你不知道怎么辦,或者發(fā)生頭痛感冒不知道怎么辦。這是借助大數(shù)據(jù)下,在AI分析里逐步走向輔助醫(yī)生或者讓用戶和醫(yī)生之間建立更多信任的工具。我們知道,國內(nèi)之前有很多做醫(yī)療的創(chuàng)業(yè)公司,基本覺得把這個市場做壞了,把醫(yī)院醫(yī)生搞得很疲憊,因為大多數(shù)邏輯,是希望醫(yī)生脫離醫(yī)院出來在線做診斷,他要形成對用戶的吸引力,也要建立后面的商業(yè)模式,這是原來的一點。

但是我們沒有這個需求,因為我們本身有用戶,用戶需要解決診斷的問題。我看到一些醫(yī)療機構(gòu),大部分來講,上不接用戶,下不接醫(yī)院,就是醫(yī)院不是他的,用戶也不是他的,在中間是沒有競爭力,他想把醫(yī)院拉到自己這邊,吸引用戶,醫(yī)生是沒有辦法獨立于醫(yī)院的,這是之前創(chuàng)業(yè)者出現(xiàn)的問題。但是我們有用戶,我們代表用戶找到醫(yī)院,找到醫(yī)生,這樣的模式能夠真正有機會成立。而且我們在醫(yī)療上也沒有創(chuàng)業(yè)公司賺錢的壓力,因為對我們而言,只要用戶認可搜狗搜索,有足夠大的搜索量,搜狗搜索有良好的商業(yè)模式,只要量大,給用戶搜索產(chǎn)品就行了,而其他創(chuàng)業(yè)公司會面臨壓力,第一是沒用戶,第二是基于資本壓力創(chuàng)造賺錢的模式,這也使得搜索引擎公司在醫(yī)療服務(wù)里能找到自己更好的位置。

我會認為百度會變得更難 ,因為百度現(xiàn)在畢竟市場份額大,他會把廣告模式轉(zhuǎn)成免費為用戶提供多種咨詢的模式,收入會下滑,我們沒有這方面的壓力,這是關(guān)于醫(yī)療上的思考。

另外,我們從英文搜索走向海外搜索,這周內(nèi)我們會有兩個升級,一是英文搜索升級成海外搜索,最后搜索的結(jié)果也是用中文呈現(xiàn),以前我們大家談到的事情是,去年有幾十個院士跑去給習(xí)近平寫聯(lián)名信,希望能對谷歌網(wǎng)開一面,如果科技工作人員不能用谷歌搜索海外科技信息,中國和世界是脫節(jié)的,國內(nèi)的科技發(fā)展就會受制約,我們可以不看國外的美劇、韓劇,但在國外科技、信息層面不能落后。但我認為不夠,即便開放的Google,但大部分人是用中文的,而世界上非常多有益的信息,包括醫(yī)療信息、科技信息,甚至大家言論上的討論都發(fā)生在英語世界里。

在這種情況下,把英文變成中文以后,我相信,98%的中國人才能更好享受全球的內(nèi)容,因為我們最強的是語言部分。正好這個時代到了,去年在AI爆發(fā)一年到年底時,翻譯技術(shù)是突飛猛進的,比原來的翻譯有快速的發(fā)展,就像語音和圖像突破,翻譯技術(shù)突破了。因此,我們有機會把翻譯和搜索做一個聯(lián)動,因此我們說搜索全世界。一個中文輸進去我們現(xiàn)在開始搜索的是全球的英文,然后我們未來考慮把全球的日文或其他文字的信息都搜索到,這樣會構(gòu)成一個獨有的競爭力,這是Google并不care的東西,因為英文是他們的母語。這種情況下,在翻譯上更多是秀研究的肌肉,Google秀8國語言的互譯,秀的是如果沒有語料,沒有中文到德文的,只有中文到英文,英文到德文,我是不是能做中文到德文的翻譯,他們是在做這樣的事情,和我們的目標不一樣。我們是實實在在希望通過翻譯技術(shù)把搜索做得更好,海外搜索也會成為搜索競爭中的差異化。

第一次從微信內(nèi)容開始,我們開始和百度不一樣,開始有了知乎、明醫(yī)和海外,這周升級完之后就可以完全用中文完全瀏覽世界的網(wǎng)頁,不僅是搜索的詞用中文搜索,結(jié)果也用中文呈現(xiàn),點出去的鏈接也全用中文來看,在一些場景里應(yīng)用也更加方便。我們內(nèi)心對這個事情有蠻高的理想,先不說賺錢的問題,因為地球上中國人是最多的,但是我們很不幸,在200年來發(fā)生的變化,英語成為世界主要溝通的語言。這么大的人群和世界主要語言有隔閡,使得用中文搜索世界,我認為,對中國整個大的復(fù)興、成為世界主旋律的一部分是有歷史意義的,我們內(nèi)部叫重寫《通天塔》的故事?!锻ㄌ焖肪褪侵v語言不通,使得各個國家的人沒法聯(lián)合起來做事情,語言通暢了之后會帶來一個新文明,就像發(fā)明火、發(fā)明電一樣,所以我們2016年在搜索做了很多的工作,從AI也是武裝到牙齒。

去年有個很著名的AI媒體負責人跟我聊,中國現(xiàn)在有兩家是在AI上最努力做報道的自媒體, 其中一家問,搜狗要轉(zhuǎn)型做AI了,我聽了一肚子火。因為搜索其實就是AI ,它就是讓機器像人一樣去思考,搜索引擎變得很聰明,能夠幫我們選擇出更好的頁面來。陸奇剛剛?cè)グ俣?,放出一句話,說搜索是AI最好的場景,搜索和AI是天生在一塊兒的。今天在做AI的很多公司,大規(guī)模做機器學(xué)習(xí)、深度學(xué)習(xí)方面,人才方面也都是找搜索公司去要人。因為有了深度學(xué)習(xí)之后,會使得搜索場景有更好的武器來滿足,甚至升級這樣的能力,而我們內(nèi)部的員工大部分受過正統(tǒng)的訓(xùn)練,怎么用這種數(shù)據(jù)和方法,大家都知道怎么讀論文去提升, 我們沒有Google或者DeepMind那種能力里面,屬于開創(chuàng)出新的算法出來,但基于上面的算法去改良的能力是足夠的。

AI里,我們在翻譯里面是往前在走,輸入法之前也是很容易地開始做語音輸入、圖像輸入,我們現(xiàn)在語音輸入量是全中國最大的,而且比其他家加起來還要多的份額,1天2億多次語音識別請求。在AI時代里,大家的理解不只是語音和圖像,AI里面最難的地方是人的思想和知識的學(xué)習(xí),不僅是圖像的識別,語音的識別,人最寶貴的不是圖像和聲音,人的難點在于知識的理解和推理能力,而這種能力是靠語言體系來支撐的,靠語言來支撐對知識和思考的表達。搜狗在這里面天生是兩個場景,一是輸入場景,讓大家用語言表達,二是用語言獲取信息。因此,我們在AI場景里細的分類是分在自然語言里,自然語言代表了對知識和思想在這里面的人工智能,這里面是人工智能最難的一塊。

往下的思考是幾個事兒, 通過語言將搜索升級到對話系統(tǒng)、問答系統(tǒng)以及翻譯系統(tǒng),這是我們核心能力的三部分 。包括《一站到底》,可以認為是搜索對未來的模式,就是提問題,不是給你10條鏈接,而是給你1個答案,實際上《一站到底》的場景相對比較窄,我們在問答處理能力上是比較寬泛的,不僅能找到實體,能在里面做更多的運算,《一站到底》是演示下一代技術(shù)中間的場景。對話系統(tǒng)也是今年的一個重心,翻譯系統(tǒng),我們會把這種能力不僅用到移動互聯(lián)網(wǎng),未來在智能硬件里也會大量地使用我們的一些能力。以自然語言為核心,我們做語音也是把它翻譯成語言,語音識別是從語音到語言,合成是從語言回到語音,但處理的核心是語言,我們要把語言的能力,結(jié)合語音、圖像和其他方式放到手機之外的硬件里。所以,我們AI的邏輯不僅是放在輸入法和搜索里,產(chǎn)品形態(tài)里有幾個關(guān)鍵詞:輸入法,搜索,自然語言的計算,自然的交互。他們支撐的地方是對話的問題,問答的問題以及翻譯的問題。我們希望在這幾個場景里,大家都能看到搜狗的聲音,尤其硬件、IoT到來的時代,無處不在會有交互和機器智能,這是對未來的判斷。

以上是搜狗過去所做的事情,以及往下對人工智能和業(yè)務(wù)發(fā)展方向的理解。

記者:川總,您剛才也提到,當百度把陸奇招過去這個事兒你怎么看?有壓力嗎?剛才你講到搜狗這么多細分領(lǐng)域的技術(shù),語音識別領(lǐng)域有科大訊飛等,感覺你進入的領(lǐng)域很多,競爭對手也有很多,這方面你是怎么來看的?

王小川:一來就提兩個競爭的問題,一個看百度,一個看訊飛。 首先陸奇,我比較多跟他打交道,搜狗之前做海外搜索,英文海外檢索部分是和bing合作,也是和陸奇談的。陸奇有兩個很大的優(yōu)點,一是技術(shù)理想主義,和他聊天能看到他一談到新的算法就兩眼放光,半夜兩三點去讀論文,是個很好的技術(shù)人。二是也不官僚,跟他談東西,也不會擺在全球華人最高職位上,而是非常平易和我們?nèi)フ劦摹_@是他的兩個特質(zhì),對他蠻尊重的。

關(guān)于科大訊飛,我認為要明確,科大訊飛是to B的公司,基因是做企業(yè)的事情,我們是做toC的公司,是和消費者、網(wǎng)民能產(chǎn)生一種連接,大家基礎(chǔ)的技術(shù)競爭力方向是不一樣的。

搜狗的技術(shù)是全能力的技術(shù),語音識別大家聽科大訊飛比較多。但目前語音識別里,用戶使用量最大的,是搜狗,遠遠大于科大訊飛,在輸入法里已經(jīng)用到了。做技術(shù)現(xiàn)在需要兩件事兒,一是有數(shù)據(jù),二是有研發(fā)AI的能力。數(shù)據(jù)能力上,我們是有優(yōu)勢的,研發(fā)能力我覺得搜狗也沒有弱的地方,尤其深處北京。從我們的應(yīng)用場景到數(shù)據(jù)積累、技術(shù)能力,我自己評估一下我們都占優(yōu)勢的位置。

去年我們已經(jīng)開始領(lǐng)跑了,在烏鎮(zhèn)大會上做同聲傳譯?,F(xiàn)在和搜索產(chǎn)品結(jié)合,也上線了fanyi.sogou.com或者translate,現(xiàn)在已經(jīng)公開了。 和訊飛的比較里已經(jīng)不是關(guān)鍵問題,我們現(xiàn)在明確和兩家公司作對比,一家百度,一家Google做對比 ,我們有信心比他們要好,直接線上能看的。無論是語音識別還是在線的翻譯,我們都比他們好。而這幾家我認為,訊飛發(fā)出來同聲傳譯的系統(tǒng)來,其他家還沒有。們是更早使用這個產(chǎn)品,發(fā)布的場面也是更加官方的(烏鎮(zhèn)互聯(lián)網(wǎng)大會),今年會有更多的場合會用到。馬上就到十九大了,我們在更嚴肅場合是敢去用我們產(chǎn)品的,搜狗的語言和翻譯已經(jīng)處于領(lǐng)跑的位置。

記者:剛才聽了王總的介紹說,海外搜索有升級,請問這里面有什么樣的技術(shù)?

許靜芳:5月份發(fā)了英文搜索,2017年1月份發(fā)的是由英文搜索升級為海外搜索,剛才川總介紹過,英文搜索的背景是,世界上有更多更好的優(yōu)質(zhì)信息在英文世界,中國用戶因為各種各樣的原因接觸、觸達到英文信息并沒有那么便捷,所以我們和bing也有合作,在國內(nèi)發(fā)了一款非常好的英文搜索。但大部分中國人在消費英文內(nèi)容時比中文還是要困難一些,便捷性沒那么強,速度沒那么快。5月份上線時,我們就有一個功能,把中文query翻譯成英文query再找英文結(jié)果。5月份魏澤西事件比較熱,關(guān)于滑膜肉瘤,有很多醫(yī)學(xué)的術(shù)語,你也不知道,中國的信息不一定全,不一定對,我想去看國外的。那問題來了,滑膜肉瘤怎么搜,怎么拼,很多用戶是這樣的反饋,一個常見的路徑是先翻譯后搜索。當時我們發(fā)布英文搜素時就有這樣的功能,自動把query翻譯成英文query。我們自己也發(fā)現(xiàn),搜索中文結(jié)果非常快,掃一眼就知道哪條是你想要的,然后點開詳細去閱讀,當看到英文或不熟悉的領(lǐng)域時就會慢下來。

我們這次升級為海外搜索的時候,就希望把這套系統(tǒng)做成一個閉環(huán),引用中文query翻譯成英文query,搜到英文內(nèi)容之后再翻譯成中文結(jié)果。這是目前唯一商業(yè)系統(tǒng)能夠把翻譯和搜索真正結(jié)合起來的系統(tǒng),翻譯用的是搜狗神經(jīng)翻譯技術(shù),在檢索部分是搜狗和bing一起合作的。這里面會出現(xiàn)很多新的問題,查詢詞是很簡短的,會有歧義,英文查詢詞還好。會發(fā)現(xiàn),搜索結(jié)果出來以后,搜索結(jié)果有標題,有摘要,里面有很多省略和專有名詞、細節(jié)去處理,包括很多開放域的翻譯,十條結(jié)果一起翻譯出來,內(nèi)容寬廣性和實時性上都提出了比較大的挑戰(zhàn)。

王小川:我補充兩個場景,用戶也用在線翻譯,在線翻譯之前的品質(zhì)是不夠的,以前用起來翻譯,覺得比我自己翻譯的差,但現(xiàn)在發(fā)現(xiàn)機器比我翻譯得好,這已經(jīng)過了一個門檻,是很重要的變化,翻譯的技術(shù)現(xiàn)在做到是能夠可用了。第二,也有清晰使用的場景,我們兩個場景在做,比較重點的是搜索里面去用。

記者:搜狗面臨一個問題,不知道你輸入時問題會面臨各種各樣的可能。

王小川:是的, 第一讓翻譯可用,第二讓翻譯找到可用真正的場景 ,這件事情都是在全球首次做到的事情,以前在線翻譯總覺得離人的使用始終是有距離的,現(xiàn)在我們已經(jīng)做到了。所以,我還是蠻興奮的,現(xiàn)在我們的翻譯品質(zhì)已經(jīng)到達了相當?shù)母叨取V虚g有些技術(shù)的細節(jié),學(xué)術(shù)界一直在講“跨語言檢索”,研究界是屬于“葉公好龍”一般的,龍沒找到就在那兒做研究。我們這次真把龍給捅下來了,發(fā)現(xiàn)里面的問題比學(xué)術(shù)界想的多得多,以前有大量研究里沒有考慮的問題,龍比我們之前想的還難,我們做了很多解決的工作。

許靜芳:搜索是開放的,對翻譯的要求,對適應(yīng)的領(lǐng)域非常多,同時它非常簡短,是有歧義的。曾經(jīng)有一個case叫寶姿,寶姿翻譯成英文是PORTS,你拿PORTS檢索就發(fā)現(xiàn),PORTS除了寶姿還有計算機端口,真實世界物理港口得意思,這樣搜索結(jié)果就會發(fā)現(xiàn)多樣性變化,搜索結(jié)果就不一定能直接滿足用戶。還有搜索結(jié)果的翻譯,每條結(jié)果里都有個PORTS,哪些結(jié)果應(yīng)該翻譯成港口,哪些應(yīng)該翻譯成端口,哪些應(yīng)該翻譯成品牌?都是問題,所以在研發(fā)過程中有一些非常有意思的問題存在。

王小川:現(xiàn)在拿到英文摘要,整句翻譯成中文大家知道經(jīng)常翻譯的是不準的,現(xiàn)在大家經(jīng)常拿整句和縮略的句子拿過來翻譯,讓我們的產(chǎn)品來干這種活。

記者:之前有消息稱搜狗將在今年IPO,請問現(xiàn)在搜狗投資方之間是否達成了一致的一件?上市計劃進展到哪一步了?

王小川:搜狗目前有兩個戰(zhàn)略投資人,一個是搜狐,一個是騰訊。戰(zhàn)略投資人與財務(wù)投資人不同,他們并不追求上市之后收益的最大化。 對于搜狗上市問題,投資方之間已經(jīng)達成了初步的共識:搜狗現(xiàn)在上市是階段性的成功。但是中間還有大量的權(quán)益問題的討論,所以現(xiàn)在并沒有一個時間表。但是現(xiàn)在多方在溝通當中,這是和去年最大的不同。這是變化。

許靜芳:現(xiàn)在產(chǎn)品的摘要和縮略是按字節(jié)數(shù)的,有可能單詞是不完整的,只能看到一半。人結(jié)合上下文是可以理解的,如果拿之前的機器翻譯系統(tǒng)來說一定是不認識的,我們借助最新的神經(jīng)翻譯技術(shù),單詞你只看到一半,它可以也具有人的特點,它能結(jié)合上下文能猜出內(nèi)容,也能夠翻譯對。當然這個階段以后也會帶來新的問題,很有意思。

記者:跨語言翻譯,翻墻之間一字之差,我們怎么區(qū)分?我們刊是國外的刊,有大量的英文,我們組織了很多翻譯者在其中,每個月都會翻譯那邊的英文,如果用了搜狗的產(chǎn)品,是不是就意味著這些翻譯者不用存在了,直接到美國的網(wǎng)站翻譯過來就可以了。

許靜芳:翻譯并沒有跨過那道墻,還是要符合中國政策法規(guī)。

王小川:舉兩個例子,用傳統(tǒng)的過濾方法或監(jiān)管方法,沒法處理的東西,沒法展現(xiàn)一個系統(tǒng),可以舉幾個例子。

許靜芳:墻我們是幫你翻的,如果我們做的技術(shù)還有缺陷的地方,會發(fā)現(xiàn)這個結(jié)果在墻外依然是打不開的,不會借助搜狗搜索就把通常不能打開的打開了。如果老有墻外的東西展現(xiàn)在搜索結(jié)果里,用戶又打不開,這個體驗非常不好。我們做的工作分兩個方面,一是把墻外的結(jié)果去掉,不展現(xiàn)在結(jié)果了。所以,哪些結(jié)果在墻外,哪些結(jié)果在墻里,我們有很多服務(wù)器,機器可以幫你自動探測哪些頁面可以打開,哪些頁面不能打開,不能打開的在墻外在結(jié)果中直接給過濾掉。二是有少量能打開,但有一些敏感信息是不符合政策法規(guī)的。政府有指定的詞,不一定該讓中國網(wǎng)民搜到,但這種詞符合中國規(guī)定時都基本用的英文,我們上線時做了很多細致的工作,翻譯成拼音,翻譯成英文。翻譯成拼音時就可以有很多的技巧,比如一個人名,每一個字單獨有空格,怎么寫,姓和名哪個在前,有很多種寫法,我們用能想到的各種情況去預(yù)防這件事情,包括搜索結(jié)果里敏感詞的翻譯,中文詞和英文詞匹配的方法,盡量把大家不應(yīng)該看的東西不在搜索結(jié)果里展示。

記者:現(xiàn)在搜狗有知乎、微信以及海外垂直類產(chǎn)品,我們往往會把它當成垂直類搜索平臺,但在通用搜索這塊,是不是意味著我們不太做了,發(fā)搜狗力點沒有在通用搜索上?而是直接通用類型的垂直類搜索。

王小川:可以理解為三點:第一,用戶用垂直搜索時,這種垂直搜索是最明顯產(chǎn)生區(qū)別的地方;第二,我們會把這種垂直的內(nèi)容也融合到網(wǎng)頁搜索里,讓搜索用戶更加方便,這像當年百度做音樂mp3搜索,得到用戶的認可。我們是做文本信息的,不管是醫(yī)療信息、還是知乎信息,還是海外信息,能更容易和網(wǎng)頁結(jié)合,能帶動網(wǎng)頁搜索本身品質(zhì)的提升,網(wǎng)頁搜索也會帶來這種差異化;第三,我們專注在往問答邁進,今天搜索引擎的使用方式是關(guān)鍵詞,給你10條結(jié)果。給關(guān)鍵詞最早不是網(wǎng)民的第一選擇,1999年,網(wǎng)民是愿意用句子的,比如“我長的好看嗎?”這樣去搜索東西,但以前發(fā)現(xiàn)不靈,機器聽不懂。所以,網(wǎng)民被培養(yǎng)著怎么琢磨用關(guān)鍵詞搜索,這是人適應(yīng)機器的過程。就像用鍵盤和鼠標,沒有自然的交互方式,人要學(xué)者用鍵盤,打拼音,打五筆。 今天大家用搜索的方式也是關(guān)鍵詞進去,是被迫的,往下的方向是讓你用完整的句子來表達。

接下來不管是手機場景還是更多IOT時代未來場景里,我們會恢復(fù)到更多用自然語言與機器溝通,做完整的提問,這需要我們用技術(shù)對用戶做更深層分析的,這個邏輯關(guān)系是怎樣的。這是四個垂直以外在研發(fā)里重點的工作,逐步還原,讓用戶的語言更加自然。

Google之前提到,未來70%的query是用問答,即給answer的方式,不是給你10條鏈接。這樣用戶會變得更加方便。這是我們研發(fā)的重點,我們也投入蠻多的技術(shù)力量來做,也有很多家(公司)在做,我們應(yīng)該是最認真的一家公司。今年在江蘇衛(wèi)視節(jié)目里有《最強大腦》和《一戰(zhàn)到底》,《最強大腦》相對火一點,我們當時做選擇。最后百度選擇的是《最強大腦》,里面演示的是聽覺和視覺的識別,走向識別的功能;而我們選擇和《一戰(zhàn)到底》合作,走向問答、是自然語言的處理,一年時間里有52期,一年中不斷升級。我們做的是搜索里的問答系統(tǒng),里面有子集,這個子集產(chǎn)品會放到《一戰(zhàn)到底》里去做,會以問答形式進行。但帶動我們在問答里繼續(xù)往下進行,所以,垂直引擎有用,垂直引擎可以放到網(wǎng)頁里用,同時我們自己也在升級。

記者:百度現(xiàn)在也在做人工智能,但他們做的人工智能和搜狗做的不太一樣。搜狗是圍繞搜索去做,百度更多強調(diào)圖片,讓它承擔更多的功能。我比較感興趣的一點,搜狗的唯一結(jié)果什么時候能夠出現(xiàn)?2017年,搜狗人工智能上都有哪些大的動作?

王小川: 我希望,10%的搜索結(jié)果會直接給你一個搜索結(jié)果,我會給其他條目,但你只看一條就夠了 ,這種結(jié)果在比例上是不斷提升的,這是我們內(nèi)部的思考。你也看到大家人工智能選擇不一樣。我們不叫以搜索為核心,而是以自然語言處理和自然交互為核心,交互的目的是為了回到語言里,這是我們的選擇,而不是圖像和語音。戰(zhàn)略選擇確實有不同。但我認為百度是沒戰(zhàn)略的公司。

記者:剛才您提到汪仔,汪仔用到了哪些前沿的技術(shù),接下來和《一戰(zhàn)到底》還要進行哪些內(nèi)容合作。剛才提到海外搜索英文資料,現(xiàn)在國外旅游的人比較多,有沒有用搜狗搜索和導(dǎo)航軟件結(jié)合的設(shè)想和海外應(yīng)用的設(shè)想。包括地圖,有時候在海外我看地圖也要看半天,這方面搜狗有沒有考慮?

許靜芳:關(guān)于《一站到底》的問題,大家看了節(jié)目以后,汪仔是對搜狗AI技術(shù)綜合的體現(xiàn),大的方面和公司本身的理念是非常一致的。兩方面,一是交互,也有很多資深的媒體人把汪仔,Watson當時去參加《Jeopardy!》這樣的活動去做對比。一個非常大不同是在交互上,《Jeopardy!》節(jié)目里是單獨給Watson一個輸入,是文字輸入,當時Watson和人的輸入方式就不一樣。

這次我們?nèi)⒓印兑粦?zhàn)到底》,機器狗汪仔靠什么?靠聽靠看,和人一模一樣,非常自然的交互方式,通過語音識別,圖像識別,把搜到的信號轉(zhuǎn)換成文字,這就是知識計算,然后做問答,交互層面上就會涉及到語言識別、圖像識別,從問答變成文字以后涉及到搜索語義的理解,自然語言的理解,答案的抽取,語義的匹配,深度學(xué)習(xí)在文本上的應(yīng)用,在汪仔身上都有很具體的體現(xiàn)。

剛剛說大的層面是符合交互和計算方面的,如果要把《一戰(zhàn)到底》的汪仔和Watson去做對比有幾個方面:

第一,語言。Watson當時用的是英文,我們是用中文實現(xiàn)。做語言的理解,不同的語言有不同的文法、語法在里面,代表著完全不同的技術(shù)。

第二,輸入方法。當時大家看到Watson的軟件形象,顯示板上圖像,背后是單獨給他特殊的文本輸入,我們通過圖像識別、語音識別去做的。

第三,比賽賽制題目設(shè)置也不太一樣,當時沃森對每個問題有明確的類,這個題目叫歷史題、娛樂題、科技題,類似大概有6個類別。其實問題的類別在《一戰(zhàn)到底》時也是中間非常關(guān)鍵的環(huán)節(jié),但這不是《一戰(zhàn)到底》題目中明確指定的,而是靠機器分析這個問題,文字里的語義代表的是,這個題目問的是詩人還是國家,還是某一種植物,都是靠機器自動分析出來。而Watson的設(shè)置題目本身就帶著內(nèi)容。

第四,搶答的時機不一樣。當時Watson有個規(guī)則,題目一定是說完了才能答,雖然機器和選手之間也有誰先搶到誰答,也等問題問完了再答,看誰快。 《一戰(zhàn)到底》里有個非常大的不同,只要主持人開始念題,在任何時間點都可以去答,自己答對了可以加分,答錯了對方加分。這代表高手可以預(yù)測題,只聽題干一部分或一小部分就能推理出來你在問什么然后我直接給答了。這個能力非常難。剛開始我們研發(fā)時,汪仔是不具備這個能力的,我們只能問答,我們是給一個完整題目,怎么樣能夠答的題目越多,每一題答的盡量打得準,這是我們剛開始研發(fā)的重心,等到后面準確率和人類頂尖選手接近甚至超過他時,整個搶答賽制里機器處于劣勢,之后我們花很長時間去做搶答。搶答有兩方面,一是速度上,爭分奪秒,我們幾毫秒地去摳,中間有語義識別,搜索、知識庫和檢索。

整個過程中,剛開始上來就是100毫秒、500毫秒,盡量比人搶得更快,每個模塊都從速度、效率上往極致走,每個模塊上速度到最后提升了好幾倍,但這不是最重要的環(huán)節(jié)。大家知道,人的語速是很快的,一秒鐘人就念了好幾個字,早5個字答,就能提前很多時間答題。所以,首先在速度上和人接近。另外,人的推理能力機器也需要有,機器也做到拿到不完整的,到目前為止所有的題目信息就是不完整的,機器首先要去預(yù)測,完整的題目要問什么,我們應(yīng)該怎么答,這塊花了非常多的時間,Watson完全不具備這樣的能力,當時比賽的賽制就告訴你,讓你答才能答。

我舉個例子,但是節(jié)目組拍了頂尖選手來做測試,像徐圣明到我們這里測試。機器出現(xiàn)一個問題,一個題目說《鹿鼎記》中哪一種毒藥?提到這個問題的時候,人已經(jīng)答了,還沒問完題呢。后來徐圣明說鹿鼎記就哪一種藥,人會推理的。 大布什、小布什的教育,大家知道要考慮是不是畢業(yè)于同一所學(xué)校?人會瞬間思能考的。機器聽到大布什、小布什在琢磨問學(xué)校的事兒就有一定的難度,搶答背后有對知識更復(fù)雜的理解 ,不像Google Instant Search說,幫你把后面的東西補完。搶答里會變得很難。 另外一方面,我們?yōu)榱怂俣瓤?,還做了很多的工作,比如光纖,發(fā)現(xiàn)賽場里是沒有網(wǎng)絡(luò)的,我們拿4G網(wǎng)絡(luò)過去不夠,所以專門拉個光纖過去,就為了省時間。

語言識別,以前語音識別,說一句話,停了0.3秒,他認為你已經(jīng)說完了。現(xiàn)在不是,要判斷什么時間他已經(jīng)說完話的,把500毫秒、300毫秒變成50毫秒,這背后要做更多分析的工作。甚至當你說一半的時候要開始計算,圖片、文字進行到一半就做計算,而不是像原來那樣等結(jié)束說話再做。Watson對于歷史題或人名,一旦限定子課題時叫封閉域,機器人會變得很多?,F(xiàn)在是屬于開放域,雖然有大的框框,問題在這個范圍里隨便問的,機器的知識在里面越變越大,越難確定。這是更難的事情。Waston做對比大家會更容易理解,汪仔背后是有綜合的技術(shù)挑戰(zhàn)。

許靜芳:因為我們跟頂尖選手確實切磋過好幾次,拿這個測試數(shù)據(jù)來看,覺得蠻有意思的,我最近也認真地把Watson當時發(fā)表一些論文翻了一下,從測試結(jié)果來看,咱們《一站到底》的頂尖選手達到了當時Watson的水平,但是我們機器狗汪仔比Watson要更好。所以說我們會發(fā)現(xiàn)人過了幾年的以后水平?jīng)]有變化,美國的頂尖選手和中國頂尖選手具有相同的水平,不一樣的地方是,機器經(jīng)過幾年的技術(shù)發(fā)展已經(jīng)發(fā)生非常大的變化,機器在不斷地提升,人相比頂尖水平就比較固定了。

王小川:大家可能都想看百度小度跟搜狗汪仔比幾場,這是不可避免的事,這個場景也是挺好的。

記者:去年花了1.8億投資了天工智能計算研究院,今年咱們還不會持續(xù)這么大的能力去投?

王小川:1.8億是一次性的投入,但實驗室會有一些額外的費用產(chǎn)生,會小一些,不會這么顯著,但足夠使得我們聯(lián)合研究有這樣的成績。

記者:和智能硬件的結(jié)合能說一下嗎?

王小川:智能硬件有三種場景,一種場景是客廳場景或家庭場景,一種是車載場景,一種是移動場景,這三個場景里我們都有切入的方式,有的是自研,有的靠合作、合資,有的是提供API,讓別人來調(diào)用。這三種情況都會發(fā)生。

記者:有更詳細的東西可以透露嗎?比如客廳具體和什么合作?因為大家提到智能硬件就是這三大場景。

王小川:客廳場景方面我們在投資里面已經(jīng)推動了,跟國內(nèi)資源互補、優(yōu)勢互補的公司正在往前走。自研像我們之前有糖貓,比較早,我們有供應(yīng)鏈,有大量的銷售點,內(nèi)部的管理團隊也建起來了,不過它不是我心目中典型的智能硬件。我對智能硬件是希望它能做判斷,能夠像人做自然的交互和后面的知識計算,它的連接工具和糖貓本身是給沒手機的孩子用的,它相當于一個試探的過程。今年我們會投入到智能硬件的自研。剛才我們講了三件事,問答、對話、翻譯,是從這幾個場景切入的。

記者:這次咱們財報使用人民幣單位,以前都是美元,什么原因?

王小川:兩個原因,一是美元升值,人民幣貶值了,這時候再用美元計價大家容易產(chǎn)生誤導(dǎo),因為之前美元和人民幣還是相對比較穩(wěn)定的,最近這幾年有大的變動, 我們用人民幣更能反映我們的競爭力和變化。

記者:我對比了去年的數(shù)據(jù),去年我們收入和盈利增長差不多50%多,是因為搜狗今年做了很大的投入嗎?

王小川:兩個原因,一個是投入很大,另外,大家知道搜索從推廣改成廣告了,就是國家把搜索的收入性質(zhì)定義改了,改了之后,這個就嚴格了很多,還有稅收等,所以有一定的政策上的影響。

記者:我們今年的投入、投資,包括在AI方面,包括明醫(yī)方面的投入會相對減少嗎?對下一個季度財報的預(yù)計會怎么樣?

王小川:我們預(yù)計比2016年多。

記者:這個問題還是想問您一個規(guī)劃,就是咱們之前的增長速度非常快,但是不可能永遠都是這么一個高速,因為在AI方面的投資會越來越大,不知道你有沒有什么計劃和節(jié)奏?

王小川:我們收入本身的規(guī)模可以說明問題,利潤不是關(guān)鍵的事兒,只要能做長遠投資,而不是計劃出來的,這只能當成中間的一個結(jié)果。

記者:去年和今年有一個特別大的不同,就是去年,您最開始做財報講解時,提到了很多新的概念和思路,但是今年我感覺把那些思路逐步地變現(xiàn),一步步地落地,把一些功能再升級的過程,今年有沒有特別大的爆炸性的、突破性的想法?

王小川:我們開始在努力提硬件這個詞,還想多爆炸呢?

記者:問一下AI這個事,我記得大概是您說2015年AI其實沒有什么突破,到了2016年,AI是有一點遇挫,您到海外跟AlphaGo團隊做交流,聊第四盤棋是怎么回事,聊深度學(xué)習(xí),深度學(xué)習(xí)遇到什么瓶頸?您怎么看待AI這件事?其實咱們跟大的AI趨勢有一些不一樣,大的方向是說AI有一點遇挫,但是今年搜狗在AI方面對外宣講、產(chǎn)品研發(fā)和推廣都會更高調(diào)一些。

王小川:最開始在AI方面談AlphaGo的時候大家都是比較悲觀的,不管是傳統(tǒng)媒體人還是IT界的人都說AlphaGo不行時,我說AlphaGo能行,還寫在知乎上。后來AlphaGo贏了,大家就開始過于高調(diào)了,覺得這個機器可能馬上把人都干掉了,講了深度學(xué)習(xí)要統(tǒng)治世界等等,當時我們內(nèi)部還在不斷往前走,但是對外我們會負責任地去發(fā)聲, 我說深度學(xué)習(xí)就有一個瓶頸的,不要把它想的什么都能干,即便做無人駕駛都沒到那么靠譜的階段,而且機器現(xiàn)在對語言的處理能力很弱。

那時候行業(yè)投資很瘋狂,大家會幻想,投資人會有一種情結(jié),看不懂的東西就覺得特別美。創(chuàng)業(yè)者本來就很瘋狂,在投資方的推動下,最后想出的事兒可能和現(xiàn)實就有差距。比如做圖像的一些公司,很多公司都在虧損,最后都賣掉。在這里面,大家對技術(shù)的可行性和商業(yè)模式?jīng)]有深度思考。深度學(xué)習(xí)有很多瓶頸,即便能做事情也要分(著看),如果只做識別、合成、生成,可能商業(yè)價值是小的。機器用來做判斷,making decision這個事情才有很大的意義。在商業(yè)價值里面我們可以想,這個事(做判斷)才是有意義的,確實有些“坑”大家都進去,但最后技術(shù)做不到或技術(shù)做到了但沒有商業(yè)上的應(yīng)用場景或商業(yè)上的收入。

現(xiàn)在為止,我發(fā)現(xiàn)行業(yè)中一部分的東西過于低迷,覺得這個東西不行或者(泡沫破滅)。但是我們知道,當機器開始能做判斷的時候,本身能夠產(chǎn)生商業(yè)智慧,它有服務(wù)上的價值和變現(xiàn)能力的,而做合成、生成和識別,是能改進交互的,而改進交互最受益的公司就是搜索類公司。所以,搜索類公司在AI行業(yè)里是受益的,而且就用它提高自然交互和知識計算,那相對是穩(wěn)健的。

記者:所以你會敲敲代碼來感受一下嗎?

王小川:我會試一下,至少我會知道,包括并行度上機器多了并行到底能不能實現(xiàn),新的算法里面怎么用,這些都是能和團隊進行討論的。 我們是真正知道,已經(jīng)不恐懼,不會從恐懼轉(zhuǎn)化為幻想,我們沒有這種幻想。所以,我們可以平穩(wěn)地往前走。 我們公司基因里,是一步一步開始去做的。搜狗目前盈利了,到了一個規(guī)模盈利的狀態(tài)。所以,其實我們有一種天生的東西,叫避免不靠譜的事情發(fā)生,如果技術(shù)上走錯路是非??尚Φ囊患?。

記者:就是技術(shù)上走通的可能性還是有的?

王小川:你會覺得有這種可能性,但是我們會小,有的公司就會大,對戰(zhàn)略不了解的公司。

記者:去年,我問您對搜索整個未來的格局是怎么看的,當時您大概提了兩個關(guān)鍵詞:問答和服務(wù)。今年過去一整年了,而且今年咱們很多東西落地了,您認為對未來的格局有沒有更細化或有一些差異、變化的地方。或者未來在那些關(guān)鍵的時間點是不是能看得更清楚一點。

王小川: 問答是一個漸變的過程,所以我們今年說10%的搜索能夠走問答,它不能做到在短期里面突然就把這個事情顛覆了,我們只能說是慢慢地成長。 它的好處在于,它可以使得你公司本身有一塊收入或者利潤支持你良性發(fā)展,讓你有機會,有更多的時間向未來布局,這是我們現(xiàn)在一個好的狀態(tài)。

但如果假設(shè)搜索引擎做到頂了,收入往下掉,你可能著急要趕緊找個大數(shù)來填它,這種壓力在戰(zhàn)略上可能會帶來很大的困難?,F(xiàn)在搜狗在AI技術(shù)能力里面,在綜合的掌握里也是最TOP的公司之一。在產(chǎn)品上,我們有自己產(chǎn)品的積累,包括硬件上,我們比其它公司更有能力去在未來布局,或者在路線里面走穩(wěn),因為AI不是一個創(chuàng)業(yè)公司、小公司就能玩得動的東西。需要數(shù)據(jù)和大量研發(fā)投入。搜索再往前走,但我們公司已經(jīng)開始對未來進行投資。

記者:搜索這塊咱們排名很清晰的,在AI這塊我們給自己怎么排名的?

王小川:搜索排名第二,這很清楚。AI方面,如果非要讓我數(shù),我覺得我們應(yīng)該在前三的位置。

記者:您覺得現(xiàn)在汪仔,您所說的NLU自然語言的理解,你覺得它達到你想象的程度了嗎?汪仔在整個搜索里的角色是什么?它只是展示品還是最后成為產(chǎn)品?就是汪仔過了《一站到底》之后,它的走向會是什么?

許靜芳:我認為,通用NLU沒有達到,或者現(xiàn)在也沒有系統(tǒng)能夠達到。如果我們聚焦在《一站到底》這樣的特定設(shè)計下,它是足夠好,不管是它回答的準確度,還是它回答的問題,它回答的時間點已經(jīng)足夠靠前,在這樣的設(shè)計下面談已經(jīng)不錯了。

《一站到底》在公司是個什么樣的地位?其實我們是先做問答然后才有《一站到底》,《一站到底》其實是問答里非常特殊甚至相對偏簡單的類別,它就問的是實體,所有的答案都是實體的一種。但是回到搜索每天面對的問答,有問實體的,也有問經(jīng)驗型的,比如“我怎么燒紅燒肉”,也有原因這種“天空為什么是藍的?”也有“范冰冰漂亮還是李冰冰漂亮”這種比較型的,或者“孕婦能不能吃螃蟹”,其實問答有很多種類別,實體是其中一種相對比較特殊的類別,在實體類別里我們把關(guān)于實體型問答應(yīng)用到《一站到底》這個特殊環(huán)境里。當然,為了參加比賽取得成績,打敗人,那又對《一站到底》做了很多特殊的優(yōu)化。所以,問答是我們未來發(fā)展的方向,《一站到底》是我們展示和挑戰(zhàn)自己的一個平臺。

記者:你覺得汪仔好看嗎?

王小川:汪仔代表的是一個形象,不管是虛擬的形象,還是對問答對技術(shù)形象的展示,這就是在整個大局里面的一種位置。往下它也會更加聰明,能力也會有人用,不限于這個事情,這是好的積累,但是能不能把它變成智能硬件類的玩具是需要論證的。

記者:今天聽您提到硬件這個詞頻率還蠻高的。我記得三年前智能手機非常好的時候已經(jīng)有人提出,智能硬件未來是取代iPhone的趨勢,從最近一兩年來,有越來越多唱衰它的聲音,所以想問下您,為什么會在現(xiàn)在來提這個詞。

王小川:好像其他幾年我一直唱衰硬件,那時候硬件特別火,因為確實死了一堆公司。硬件為核心的時候是資本驅(qū)動的,是用到一個概念里去,為了硬件而硬件。 如果做個體重秤踩一腳就能夠輕一兩肉,賣8000元也有人買。回到智能硬件的意義里面去,比如做智能插座我覺得不是個關(guān)鍵的問題,是資本推動的。 現(xiàn)在智能硬件核心的東西,是把自然交互和做判斷的能力放進去,機器在里面能做交互和判斷。微軟的手表一直賣得不太好,因為它屏幕小,里面AI不夠聰明沒有辦法取代手機。比如天氣預(yù)報,手機上可以顯示出今天明天后天、刮風(fēng)、下雨、PM2.5指數(shù)。手表上信息量是不夠的,如果它不夠聰明,不知道你要什么。當然現(xiàn)在沒法排這么多,因為不實用。如果AI足夠好了,“你問他明天要不要洗車嗎?”它會給你一個答復(fù),這個時候智能硬件足夠聰明,交互足夠簡單,就能跑起來了,智能硬件要看交互能力和判斷能力是否夠強,以這個少屏幕甚至沒有屏幕的方式就能夠做這樣的承載,否則就沒有這個智能硬件的意義。一個新硬件做成必須讓比手機更便捷,讓它在數(shù)據(jù)處理能力上更強才行。以前智能硬件數(shù)據(jù)處理能力也沒更強,也沒法更便攜,那就是為硬件而硬件的事情。

記者:剛才您說在智能硬件上會找合作伙伴,這個事情也在推進當中。您要找合作伙伴的話,標準是什么?

王小川:在硬件領(lǐng)域里,第一,是很有靈性的市場敏感度,把智能硬件做好,我開放能力給你,開放API給你,你在里面跑硬件,以合作伙伴為主。第二,對方有平臺級的能力,有大規(guī)模開模、建模、設(shè)計能力、供應(yīng)鏈管理能力,它也有戰(zhàn)略的意義在,我們可以用一種合資的模式去進行,當然也會對它開放能力。第三,就是偏向于我們自己的能力,比如翻譯,也有可能自己就干了。

記者:您提到國家廣告法的調(diào)整,對搜狗有一定的影響。過去來看,這個影響的幅度或規(guī)模大概在什么樣的區(qū)間?

王小川:舉個例子,廣告法就是收入里面減3%的稅,利潤里就更多了,比如有的是20%,那就是減掉3/20,就可能15%的利潤就沒了,在利潤中會放大的。還有廣告知識的監(jiān)管和行業(yè)的限制,有的行業(yè)就不讓你投廣告了,我不是指醫(yī)療,其他行業(yè)都開始限制。

記者:您剛才說糖貓,2015年、2016年還是挺火的,后來覺得它不是你理想中的智能硬件,去年的聲音很小。但我看360推它的兒童手表還是挺火的。

王小川:糖貓從戰(zhàn)略意義上來說對我們是入門,我們通過智能硬件建立了分銷渠道和供應(yīng)鏈管理。更多為了我們跟這些設(shè)備公司對話的時候不外行,我們達到了這樣的目的,之后我們往下AI多走一走,這股力量就會跟上。糖貓我們會做好,這是我們硬件戰(zhàn)略中間的一部分。糖貓做的好不好,和搜狗并沒有直接的干系。

記者:百度也在做自動駕駛的東西,車載畢竟是比較好的場景,您有什么樣的考慮?

王小川:無人駕駛有兩個事,一個是無人駕駛里的輔助系統(tǒng)、導(dǎo)航系統(tǒng),這個事情是有意義的;但開車目前還無法完全實現(xiàn)。

記者:我們在車載這塊合作是不是B端的合作,與汽車廠商進行合作?

王小川:會在里面做一些東西,但不是無人駕駛這個事情,開車這事兒不是搜索公司該干的。

記者:聚焦在語言導(dǎo)航是嗎?

王小川:對,自然交互和實時計算,導(dǎo)航在這個范圍里。

記者:搜索引擎,我看您對它核心競爭力的描述,一是自然語言的交互,二是知識計算,因為前兩年我看到搜狗投資了知乎。今天聽您說會在醫(yī)療和海外方面,其實這都是一個知識的體系。為什么不是信息,而是做知識方面的東西。

王小川:語言是一種載體,像我們搜圖片的時候,只關(guān)注圖片周邊的文字其實沒有理解圖片本身。這種載體要往人工智能做更深是需要對信息的內(nèi)容有更多的理解, 如果文字或叫Language這個詞比較淺層,要挖Language背后的東西叫knowledge,背后的信息在這兒,叫知識。

記者:今年跟知乎有沒有比較大的合作?

王小川:知乎在搜狗投資之后,搜索已經(jīng)漲了6倍,流量也漲了很多,在我們看來,這個合作是在穩(wěn)健的模式里,知乎成長得特別快。

記者:今年跟他們高管團隊有沒有做一些比較大的溝通?

王小川:喝酒算嗎?

記者:還是談?wù)?jīng)業(yè)務(wù)的事吧。

王小川:我們增加了投資額,提升在知乎的投資額。

記者:小度在《最強大腦》上所完成的項目汪仔也能完成嗎?這兩個產(chǎn)品在您看來,它體現(xiàn)的兩個公司,比如在人工智能的技術(shù)和產(chǎn)品路線上有什么不同?現(xiàn)在做汪仔,是不是意味著搜狗下一步在人工智能繼續(xù)在商用上做的是家用機器人或者教學(xué)類機器人?

王小川:我沒有表達要做家用機器人或者教育機器人,只是說我們要做智能硬件。從能力上講,雙方的不同點,我們強調(diào)的是語言,即便我們有圖像和聲音,但是更多回到語言上,而小度的研發(fā)是圖像識別方面。

記者:語音這塊百度也在做。

王小川:語音大家都做,但是語音的品質(zhì)我們是最好的,語料規(guī)模我們也是最大的。

記者:其實去年注意到咱們有很多的場景,尤其輸入法,O2O也在里面,這里面會不會衍生出一些新的商業(yè)模式,您的摸索上有沒有一些經(jīng)驗和試錯?各個AI平臺都在努力爭取跟廠商合作,包括訊飛主要是偏B端的。你們會著力于哪些點去吸引它?現(xiàn)在各家都會在垂直領(lǐng)域突破,訊飛是教育,我們側(cè)重于醫(yī)療,所以在這個垂直領(lǐng)域上,你們以什么路徑實現(xiàn)?去年AI開始在中國大熱,人才薪水也不斷提高,有的人才成本占50%都有,您怎么看這個問題?搜狗在人才積累上有什么樣的做法?

王小川:第一個問題,輸入法一直在試探的地方是從工具到服務(wù),已經(jīng)有一些變化在做了,像輸入法有花鍵,點了觸碰,幫你找圖片,幫你做翻譯,幫你做音樂的分享,從聯(lián)想的分享里我們做嘗試,我們大的邏輯是從工具變成幫用戶做選擇的事情,沒有變過,產(chǎn)品上也在做升級,對于新產(chǎn)品是可以期待的。

記者:盈利模式上會有一些推進嗎?

王小川:現(xiàn)在我們主要產(chǎn)品上能夠接受,只要能夠被接受,能夠幫用戶做選擇,就能夠有商業(yè)模式,用戶端上用戶也會感興趣。

關(guān)于AI廠商的優(yōu)勢,比如我們做導(dǎo)航,不僅有語音識別、語音合成,還有自然交互對話系統(tǒng),背后其實有更多的知識,比如搜狗有地圖,在產(chǎn)品里如果不把地圖的能力穿透,最后你分成兩個公司做的效果不好。我們有服務(wù)的能力,比如去機場,問你航班號,你知道飛機什么時候起飛,可以把這種能力帶到對話或用戶交互里,知乎做語音、自然語言,做不到這個事情的,這就是服務(wù)能力跟著一塊就出去了。是這樣的區(qū)別,搜狗2C里面積累了大量對用戶服務(wù)能力。

垂直領(lǐng)域里面,做醫(yī)療,我本身沒有把它當成是新的業(yè)務(wù)來看,我認為,它是搜索下的一個延展,訊飛做教育是行業(yè)開拓,和我們的性質(zhì)不太一樣,不是想不斷到不同的行業(yè)里去,我們還是想在信息獲取、信息表達、自然語言交互里做,這方面我們更聚焦的。但我們可以輸出能力,教育機構(gòu)要用這個能力的我們會輸送給別人去干,我們并不求在這里面占據(jù)多大的市場份額或規(guī)模性的收入利潤。

關(guān)于AI人才,需要我們更多的投入,搜狗今天的狀態(tài),這個公司大概也有兩千多人,算上兼職學(xué)生加起來也有小三千人,當然這里面我們自己培養(yǎng)的人會非常多。我們?nèi)フ腥耍?0個人進來,就是10/3000,和創(chuàng)業(yè)公司相比起來已經(jīng)沒有不是什么大的壓力。

隨意打賞

搜狗 人工智能 王小川王小川 人工智能搜狗ceo王小川搜狗王小川ai搜狗q3財報搜狗王小川
提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 色综合久久天天综线观看 | 免费国产成人高清在线观看视频 | 久久这里只有精品66re99 | 中文字幕亚洲欧美日韩高清 | 久久日本精品99久久久 | 四虎黄色影视库 | 天天爱天天色天天干 | 中文字幕在线一区二区三区 | 成人免费视频视频在线观看 免费 | 九九影院 影片 | 天天干天天拍天天射天天添天天爱 | 久久久91 | 色综合天天干 | 狠狠色丁香婷婷综合精品视频 | 国产欧美日韩高清专区手机版 | 日韩午夜片 | www性| 久久一本精品久久精品66 | 免费一级毛片不卡在线播放 | 综合啪啪| 久久久免费观成人影院 | 亚洲精品日本 | 久 在线播放 | 欧美交换乱理伦片120秒 | 精品夜夜春夜夜爽久久 | 久久亚洲国产午夜精品理论片 | 国产91精品福利在线观看 | 亚洲国产一区二区在线 | 2020久久精品永久免费 | 99免费观看 | 精品久久久久久久 | 久久久久久久久影院 | 欧美一级免费 | 色综合久久中文字幕网 | 国产精品成在线观看 | 狠狠骑| 色涩网站在线观看 | 日日摸夜夜添夜夜添久久 | 亚洲精品欧美在线 | 色尼玛亚洲综合 | 亚洲免费在线视频播放 |