人工智能第一股"科大訊飛"最近遇到了一些麻煩
8月27日,訊飛的股價開始了毫無征兆的閃崩跳水,8月27日-28日兩個交易日累計跌幅10%,市值瞬間蒸發(fā)。
薛云奎對科大訊飛的市值提出質(zhì)疑,稱科大訊飛是股市上的大公司,財報上的小公司。該公司2016年度的銷售額為33.2億,稅后凈利潤為4.97億。他就此提問:一家小公司何以在證券市場上賣出800億至900億的市值?

薛云奎分析認(rèn)為,科大訊飛代表的是時下最熱門的人工智能概念。它所擁有的核心技術(shù)是智能語音識別與合成,其產(chǎn)品已占到中文語音技術(shù)60%以上的市場份額,語音合成產(chǎn)品70%以上的市場份額,而在電信、金融、電力、社保等主流行業(yè)的份額更是高達(dá)80%以上。不過他話鋒一轉(zhuǎn),“看生意的關(guān)鍵還是要看業(yè)績,尤其是財務(wù)業(yè)績。”
他認(rèn)為科大訊飛的財務(wù)業(yè)績是表面光鮮但含金量低,最后指出,公司利潤不可持續(xù),在其光鮮的增長背后,其實隱含了巨大的風(fēng)險。
其實,這半年媒體對于語音交互產(chǎn)業(yè)的關(guān)注度非常高,一直以來看多和看空的聲音爭執(zhí)不下。此次股市風(fēng)波,又一次把這個問題擺在大家面前。
那么,此次科大訊飛的股價震蕩是實屬個案?還是真的是語音交互產(chǎn)業(yè)存在巨大風(fēng)險?人工智能會再次遭遇新一輪凜冬嗎?
因為在語音交互行業(yè),還有很多互聯(lián)網(wǎng)巨頭,如百度、阿里、騰訊,以及創(chuàng)業(yè)公司,況且人工智能時代真正落地產(chǎn)業(yè)的是遠(yuǎn)場語音交互,而不是科大訊飛所擅長的近場語音交互。
除此之外,從市場和技術(shù)兩個角度來看,大家看待這個新興市場的時候也有點過于謹(jǐn)慎和悲觀了。
首先,從市場的角度來看。從大格局來說,這個行業(yè)確實還沒有形成規(guī)模,全球年收入也就在100億人民幣以內(nèi)規(guī)模。但是語音交互天生有個優(yōu)勢,就是如果未來世界需要機器更加智能,那人機交互就是首要解決的問題,我相信大部分人無法忍受一個不懂人話的機器還叫智能。如果這個趨勢我們達(dá)成共識,那么對于這個行業(yè)趨勢的質(zhì)疑就無法立足。
再從具體的點來看,語音交互輻射太多的人工智能相關(guān)產(chǎn)業(yè),其實是個龐大的產(chǎn)業(yè)集群,剛剛興起階段,必然就需要一個突破口來落地。很明顯的是,這個突破口應(yīng)該是當(dāng)前非常火熱的智能音箱。全球幾乎所有互聯(lián)網(wǎng)巨頭創(chuàng)歷史的達(dá)成共識,聚焦于一個小小的智能音箱,這絕不是偶然,即便頭腦發(fā)熱,也不可能如此跟風(fēng)。
其實智能音箱成為這個突破口,有著自身天生的優(yōu)勢:
1)音箱是在線音樂落地的天然載體,而在線音樂是剛需但正尋求突破的產(chǎn)業(yè);
2)而且音箱形態(tài)本來沒有觸摸屏,不會讓萌芽的語音交互被觸摸交互所秒殺;
3)另外音箱是市場已經(jīng)驗證的成熟品類,恰好也處在從藍(lán)牙音箱升級的風(fēng)口。
這樣看來,不管在智能音箱上怎么折騰,其實趨勢風(fēng)險都不會是太大,這就會讓廠商將精力聚焦到產(chǎn)品打磨而不是研判趨勢方面,更容易誕生用戶口碑較好的產(chǎn)品。事實上,智能音箱的銷量已經(jīng)被市場證明了,Amazon的Echo銷量已經(jīng)過千萬,而小米的小愛同學(xué)第一批產(chǎn)品公測就獲得了超過百萬用戶的參與,這說明智能音箱的概念其實已經(jīng)被用戶所接受了。

現(xiàn)在最需要解決的就是降低廣大用戶體驗智能音箱的門檻,北美的亞馬遜、谷歌、蘋果在行動,韓國的三星也正式入局。近來,日本廠商索尼、松下也開始宣布搶進(jìn),在德國IFA上發(fā)布了智能音箱產(chǎn)品。國內(nèi)除了創(chuàng)業(yè)公司,阿里和小米都在行動。所以說,恰恰是看到了這一點,小米能超越此前發(fā)貨的眾多智能音箱,未來銷量脫穎而出也是大概率事件。
但是當(dāng)前市場的智能音箱又有點過熱了,眾多的創(chuàng)業(yè)公司也擠入巨頭們競爭的主賽道,很多時候媒體也夸大了智能音箱的作用。
人工智能時代,我們的入口絕對不再僅僅只有PC、智能手機或者智能音箱,而應(yīng)該有更多的入口出現(xiàn),比如智能電視、智能盒子、智能汽車、智能耳機,甚至智能冰箱、智能攝像頭等。智能音箱,更準(zhǔn)確的定位應(yīng)該是人工智能的突破口,迄今為止,大眾真正有了一款可以解放雙手自由操控的機器,這對于遠(yuǎn)場語音交互具有劃時代的意義,或許還將引起更多一連串的反應(yīng)。
遠(yuǎn)場語音交互其實已經(jīng)邁過了這個坎,其中最為關(guān)鍵的兩項技術(shù):麥克風(fēng)陣列和遠(yuǎn)場語音識別其實都已經(jīng)相當(dāng)成熟。麥克風(fēng)陣列技術(shù)屬于聲學(xué)領(lǐng)域范疇的技術(shù),更加偏重于物理,這個技術(shù)其實在聲學(xué)領(lǐng)域已經(jīng)發(fā)展了幾十年,其原理和方法并沒有突破理論的邊界。

而遠(yuǎn)場語音識別,其模型和算法也都是機器學(xué)習(xí)的成熟技術(shù),大部分場景的復(fù)雜性其實依賴麥克風(fēng)陣列解決,其核心是用海量數(shù)據(jù)彌補麥克風(fēng)陣列的不足。
因此,當(dāng)語音交互行業(yè)從近場邁入遠(yuǎn)場領(lǐng)域,并不存在技術(shù)上的不可逾越,這就規(guī)避了技術(shù)導(dǎo)致的趨勢風(fēng)險,這很重要,因為很多新興行業(yè)未能崛起就是因為技術(shù)上還存在重大缺陷。
但是,不存在技術(shù)鴻溝,不是說遠(yuǎn)場語音交互沒有技術(shù)壁壘,恰恰相反,正是因為技術(shù)的升級導(dǎo)致了競爭格局的重新洗牌。技術(shù)總是會產(chǎn)生類似的效果,比方說顯示領(lǐng)域經(jīng)歷了CRT、LCD、LED、OLED的技術(shù)升級,而這種升級誕生了很多新巨頭,同時也導(dǎo)致了一些巨頭的沒落。同樣,手機領(lǐng)域從電話、尋呼機、功能機、智能手機的技術(shù)升級,也導(dǎo)致了類似的結(jié)果。
因此,語音交互領(lǐng)域從近場到遠(yuǎn)場的技術(shù)升級,也給很多初創(chuàng)的公司留下了很大的想象空間。但是,這對于創(chuàng)業(yè)公司來說也并非都是利好,因為這意味著競爭的加劇,即便科大訊飛也是如此。