欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

雙十一背后,藏了個價值千億的AI推薦系統

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

雙十一背后,藏了個價值千億的AI推薦系統

“天空為什么是藍的?螢火蟲為什么可以發光?為什么雙眼總是一起轉動?”面對小朋友的十萬個為什么,父母、老師總會借助儲備的知識,或者查閱書籍解答疑問。

但隨著內容的爆發性增長,想要得到一個問題精準的答案難度越來越大。

早年使用網上購物平臺的用戶,需要一步步根據商品的分類搜索,才能在海量的商品中找到適合自己的商品。

2022年的雙十一,普通的消費者不僅可以輕輕松松就篩選出自己想要的商品,還會收到非常符合自己喜好的商品、直播的推薦。

這背后隱藏了推薦系統的變遷,在小朋友問父母問題的場景里,父母其實就充當的是小朋友的推薦系統,但普通人的知識儲備畢竟有限。互聯網時代,有了搜索引擎,但還不足夠。

再后來,AI技術的興起,幫助了推薦系統大步前進,無論是購物平臺的商品推薦,直播平臺的主播推薦,還是視頻平臺的視頻內容推薦,越來越多的人開始感嘆,AI更懂自己。

AI推薦系統,也默默成為了互聯網公司業務中重要的組成部分。數據顯示,在一些全球大型在線網站上, 即使推薦內容的相關性僅提高 1%,其銷量也會增加數十億, AI推薦系統無疑是藏在眾多互聯網應用背后的高價值系統。

不過,高價值的AI推薦系統目前還有被少數公司負擔得起,如何才能實現AI推薦系統的普及?我們又合適才能擁有完美的AI推薦系統呢?

推薦系統背后的算力演進

推薦系統并不新鮮,互聯網公司們為了能夠提升業績和客戶滿意度,十多年前就開始了推薦系統的研究與應用,早年間他們采用傳統的方法,比如協同過濾等,CPU也足以滿足那時推薦系統的需求。

但隨著推薦系統應用需求和算法的演進,系統越來越復雜,需要更加強大的底層算力作為支撐,推薦系統的開發者發現一個問題,通信節點間的性能遇到了瓶頸。也就是說,在服務器達到一定的規模之后,繼續增加服務器的數量已經很難提升推薦系統的效果。

這就促使推薦系統的推動者們尋找更強大且更合適的算力支撐。當然,這個過程中還有一個重要的推動力——AI。 在推薦系統中引入AI之后,能夠增加推薦系統的效果,但與此同時也讓推薦系統變得越來越復雜。

一個典型的推薦系統,包含了召回、過濾等過程,AI的引入,需要使用越來越多的數據進行訓練,以達到預期的效果。

雙十一背后,藏了個價值千億的AI推薦系統

“推薦系統中引入深度學習之后, 大家還是會習慣性先用CPU,但后來發現在深度學習的算法里多加幾層神經網絡可能就算不動了。 ”NVIDIA亞太區開發與技術部總經理李曦鵬在2022云棲大會期間對雷峰網說,“GPU此時有明顯的優勢,GPU的算力遠高于CPU,同時GPU的帶寬比CPU高非常多,我們的Hopper架構GPU的帶寬已經達到3TB / s。”

但要加速推薦系統,不止是從CPU遷移到GPU這么簡單。

雙十一背后,藏了個價值千億的AI推薦系統

GPU如何加速AI推薦系統?

推薦系統中AI的引入,讓推薦系統變得更加復雜的同時,對算力的需求也呈現出指數級的上升。

在推薦系統中,有大量的嵌入表(Embedding), 包含各種推薦系統所需的特征,比如性別、年齡等等,嵌入表被用于將輸入數據中的離散特征映射到向量,以便下游的神經網絡進行處理,大小可以達到TB級。 嵌入表通常是內存帶寬和容量密集型, 對于計算的需求不大,需要很大的內容容量和帶寬進行快速讀取,這對于CPU而言是一個明顯的挑戰。

雙十一背后,藏了個價值千億的AI推薦系統

此時,采用GPU有兩個顯著的優勢, 李曦鵬說:“一個是GPU的內存帶寬遠高于普通服務器,另一個是遷移之后將原來節點上的通信從原來CPU和GPU的PCIe通信,變成了GPU和GPU之間的NVLink通信,速度提升幾倍?!?

接下來,就需要用AI模型進行計算,此時可能是計算密集也可能是內存帶寬密集。更麻煩的是,由于模型越來越大,超出了GPU板載的存儲容量,沒辦法存儲完整的模型,需要把它分塊,嵌入表就需要做模型并行,而DNN部分需要數據并行。在這個過程中, 從模型并行到數據并行,需要做非常多數據交換,成了大量計算節點間密集的通信。

“推薦系統需要的不僅僅是GPU,而是加速計算?!? 李曦鵬指出,“加速計算不是一個簡單的芯片或者硬件,而是一個包含硬件、軟件以及上層應用的一整套解決方案?!?/strong>

比如英偉達為推薦系統推出的NVIDIA Merlin。在預處理方面,NVIDIA Merlin NVTabular可以實現加速。

雙十一背后,藏了個價值千億的AI推薦系統

針對嵌入表,Merlin Distributed-Embeddings可以方便TensorFlow 2 用戶用短短幾行代碼輕松完成大規模的推薦模型訓練。并且,NVIDIA Merlin Distributed-Embeddings 的性能表現也十分突出, DGX-A100上的Merlin Distributed-Embeddings 方案比僅使用 CPU 的解決方案實現了驚人的683倍加速。

NVIDIA Merlin還有HugeCTR的開源框架,目標是優化 NVIDIA GPU 上的大規模推薦。

也就是說, NVIDIA Merlin是一個針對推薦系統,近似于一個端到端的解決方案。

即便如此,推薦系統的普及依舊面臨著巨大的挑戰。

普及推薦系統的兩大挑戰

推薦系統作為高價值的AI系統, 普及面臨的兩大挑戰就是差異化以及高門檻。

“我們充分理解,由于業務的不同于推薦系統有很大的差異, 我們會盡量把NVIDIA Merlin的功能進行模塊化, 客戶可以根據需求選擇不同的模塊,使用的模塊越多,效果也會更好?!崩铌伫i說,“我們通過Merlin的模塊化解決問題的同時, 也通過和像阿里云這樣的云計算服務商合作推動推薦系統的普及。

雙十一背后,藏了個價值千億的AI推薦系統

不同的推薦系統使用的算法并不相同,雖然如今AI大模型的應用越來越廣泛,并且大模型在美國人工智能學術界將其稱為基礎模型(Foundation Model),但這并不意味著所有推薦系統都需要使用大模型。

李曦鵬的觀點是,大模型提供一個更大的嘗試空間,其表征能力也更強,所以主流公司的模型越來越大, 但主流公司也會有一些小的業務,或許也會有一些小的模型。如今主流的公司已經過渡到了GPU方案,比較重點的業務是全GPU的解決方案。所以, 在算法上,即便主流公司也有階梯。

“先進模型對于中小企業來說收益可能沒那么大,因為他們的業務體量沒那么大,而通過云計算的方式,以及GPU的解決方案,可以幫他們降低門檻和成本?!崩铌伫i進一步表示。

差異化需求之外,推薦系統普及的另一大挑戰就是高門檻。

互聯網巨頭有成百上千人的團隊在做推薦系統, 中小企業很難投入這么多。但通過我們和阿里云這樣有能力的云服務提供商合作,給中小公司開放一些更高級的API,有一些預定義的模型能夠實現不錯的推薦系統, 投入一兩個數據科學家,這將有利于推薦系統的普及。 ”李曦鵬說。

推薦系統的普及,將能夠代表加速計算巨大的想象空間。

10年100倍,加速計算價值千億的巨大空間

過去幾十年間,得益于摩爾定律,算力在持續增長。但如今摩爾定律已經放緩,從最初每年1.5倍性能的提升,下降到如今每年1.1-1.2倍的提升。摩爾定律帶來的算力提升已經難以滿足包括推薦系統在內應用對算力指數級的性能增長需求。

“接下來的十年,所有的計算任務都將被加速。 我們已經加速了世界上5%的計算任務——價值百億美金。 加速計算會降低計算任務的成本,提高能源利用率,給工業界帶來更多的能力做更多的事情?!庇ミ_CEO黃仁勛在今年十月時表示。

僅看推薦系統,Mordor Intelligence 發布的數據指出,推薦系統整體市場將從2020 年僅為 21.2 億美元提升至2026年的 151.3 億美元。加速計算顯然具有數千億的市場空間,但要加速如此之大的市場,需要性能的持續提升。

加速計算的目標是保持每年1.6-1.7倍的性能增長,5年可以實現10倍的性能提升,10年就可以實現100倍的提升,這與摩爾定律10年可以實現的4倍性能提升形成了顯著的差異。

雙十一背后,藏了個價值千億的AI推薦系統

前面已經提到,加速計算不止是從硬件的層面實現性能的提升,更加強調從硬件到軟件再到應用的加速,實現性能的飛躍。

實際上,加速計算的價值已經在AI應用中體現出來,以前訓練一個AI模型,周期以周來計算,調整模型訓練至少又得等一周,而現在,即便模型越來越大,訓練一個模型的時間也只需要幾分鐘了。

“幾年前難以訓練的大模型,早已成為了過去式。更多更大規模的工作負載等著去加速?!?/strong> 李曦鵬對于加速計算能夠實現目標也十分有信心。 雷峰網 (公眾號:雷峰網)

雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知 。

隨意打賞

  • CPU上跑AI 從推薦系統的演進看CPU的崛起 原創

    砍柴網  ? 
    作者:金旺英特爾用“芯”智生產力,為企業數智化轉型提供澎湃算力。 在信息和數據極度繁榮的當下,人工智能正在通過各種方式影響著人類生活。其中,AI推薦系統作為 互聯網 時代最關鍵的伴生技術之一,正在幫助人類梳理著各種紛繁雜亂的信息,讓資源實現更精準的調配,讓一切變得井然有序。 推
  • 淺論平臺推薦系統之惡

    虎嗅網  ? 
    本文來自微信公眾號:MacTalk(ID:MacTalkPro),作者:池建強,原文標題:《宣泄情緒式的表達太多了》,頭圖來自:視覺中國 昨天社群里,有讀者問我寫一篇公眾號文章需要多長時間。我說拿 這篇舉例子 ,從初稿到修改,再到后面的排版,怎么著也得兩個小時吧。這還算比較順的,因為內容基本已經
  • 微美全息開發基于大數據分析模型的智能旅游推薦系統

    砍柴網  ? 
    隨著 互聯網 的高速發展與人們的生產生活產生了高度依存的關系,在數據驅動的市場中,推薦系統已成為眾多互聯網服務的行業中不可或缺的模塊。推薦系統作為互聯網公司的強大工具,已經在電子商務等眾多通用互聯網平臺的應用程序中廣泛應用。然而,盡管推薦系統采用了深度技術,例如對電子商務應用程序中的數據流進行
  • 微美全息開發基于多模態深度學習技術優化視頻個性化推薦系統

    砍柴網  ? 
    隨著技術和信息社會的快速發展,現在獲取大量信息變得更加容易。然而,目前已經進入一個信息過載的社區趨勢,信息過載可能導致更糟糕的決策,并給用戶帶來焦慮和疲勞感。推薦系統作為信息過濾的解決方案,可以通過個性化的內容和服務緩解信息過載問題。在過去的十年中,推薦系統已成為處理信息過載的最佳方式之一。無論是在流
  • 微美全息發布用于高效推薦系統的注意力自動編碼器網絡

    砍柴網  ? 
    在當今信息爆炸和資源過載的時代,個性化推薦系統成為幫助用戶高效獲取所需信息的重要工具。WIMI微美全息日前宣布推出一項創新技術——用于高效推薦系統的注意力自動編碼器網絡(Attentional Autoencoder Network for Efficient Recommendation System),該技術將推薦
  • 奇客 研究顯示推薦系統能使用 AI 操縱人的偏好

    奇客資訊  ? 
    「星期一」Hello Monday研究顯示推薦系統能使用 AI 操縱人的偏好 我們所欣賞、所閱讀和所購買的很多東西是 YouTube、Twitter 和 Amazon 等網站通過推薦系統滲透到我們的意識中的。定制化的算法推薦旨在增加廣告流量、點擊或購買量。推薦系統有時候會讓用戶覺得算法根本不了解我們,但有
  • 快手電商首發信任年報:信任指數納入商家推薦系統

    砍柴網  ? 
    3月4日,快手電商發布《2021快手電商信任建設年度報告》,這是快手電商自去年明確信任電商的發展戰略以來,首次對外系統性披露平臺信任生態建設和治理情況。值得注意的是,消費者信任指數被納入快手電商的商家推薦系統,依據多個影響消費者信任的動態指標評估結果,信任指數高的商家會得到更多流量推薦和經營權益保障。
  • 快手電商首次發布信任建設年報 信任指數納入商家推薦系統

    砍柴網  ? 
    3月4日,快手電商發布《2021快手電商信任建設年度報告》(“下文簡稱“報告”),這是快手電商自去年明確信任電商的發展戰略以來,首次對外系統性披露平臺信任生態建設和治理情況。值得注意的是,消費者信任指數被納入快手電商的商家推薦系統,依據多個影響消費者信任的動態指標評估結果,信任指數高的商家會得到更多流量推薦和經營權益保
  • 達觀推薦系統助力電商行業精細化運營

    產品壹佰  ? 
    伴隨著實體行業的數字化轉型,以及網民數量、物流快遞行業的快速增長,電商平臺之間的競爭也日趨增大。如今,電商行業已然進入創新發展階段,如何直面行業痛點,在眾平臺中“殺出重圍”呢?電商行業痛點多 用戶對商品的需求不是單一的,如何面對不同用戶多種多樣的需求? 快
  • 評論
提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 日本中文字幕有码 | 久久夜色精品国产欧美 | 国产在线精彩视频二区 | 六月丁香深爱六月综合激情 | 精品免费国产一区二区三区 | 日本高清视频www夜色资源网 | 国产毛片在线高清视频 | 国产成人精品高清免费 | 久久成人亚洲香蕉草草 | 欧美一区2区三区3区公司 | 成人午夜在线观看 | 婷婷色网 | 国产精选在线播放 | 亚洲欧美日韩一区超高清 | 欧美激情区 | 国语一级毛片 | 久久香蕉国产线看观看亚洲片 | 亚洲视频在线观 | 天天久久狠狠色综合 | 狠狠操美女 | 九九热在线播放 | 天天干天天色天天 | 成人影院在线观看kkk4444 | 国产高清a毛片在线看 | 99国产在线 | 5060网午夜一级毛片在线看 | 高清一级毛片 | 国产精品不卡视频 | 操久久| 日本亚洲欧美美色 | 国产九九在线视频 | 国产精品麻豆a啊在线观看 国产精品麻豆高清在线观看 | 日本三级中文字幕 | 久久是免费只精品热在线 | 亚欧人成精品免费观看 | 亚洲国产成人久久综合一 | 欧美美女啪啪 | 日本高清不卡视频 | 欧美曰批人成在线观看 | 九操网| 亚洲国产精品成人午夜在线观看 |