欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

產(chǎn)品推薦系統(tǒng)架構(gòu)初探

產(chǎn)品壹佰 ? 8年前掃碼分享

我是創(chuàng)始人李巖：很抱歉！給自己產(chǎn)品做個廣告，點擊進來看看。

想象一下，站在推薦引擎面前的你被抽離出一個數(shù)字的軀體。你找到一面鏡子，卻驚詫的發(fā)現(xiàn)自己的身體被無數(shù)數(shù)據(jù)所填充，許是：科技10%、籃球4%、熱火隊2.3%、歷史1%、自然0.3%。你仔細觀察，甚至發(fā)現(xiàn)了很多連你自己都沒有注意到的細節(jié)：雖然熱愛旅游，但你喜歡博物館遠多過自然景觀。當然，你也會發(fā)現(xiàn)自己的身體上仍然有一團團的迷霧，那是尚未被系統(tǒng)所發(fā)掘的興趣點。

專門為你適配的內(nèi)容如一群螢火蟲般朝你涌來，你伸手點擊了一條內(nèi)容將它點亮。就在點擊的那一瞬間、你身上的迷霧有一絲散去了，同時顯示出了新的興趣點：“極限運動：0.01%”，那些原本就存在的密密麻麻的數(shù)字也有一些發(fā)生了變化：有的權(quán)重上升、有的權(quán)重下降。每一次選擇與反饋，你都在進化著自己的數(shù)字軀體。

現(xiàn)在，你生出了雙翅、原地飛翔了起來，能夠從高處俯瞰整個推薦系統(tǒng)。你看到了一個又一個數(shù)字擬態(tài)的人，在不同的信息流中暢游。每個人身邊圍繞著許許多多的信息光點、又同其他人之間有著若隱若現(xiàn)的連接。一個個信息被閱讀的點亮、被忽略的變暗。每一個被點亮的光點就像被延續(xù)了生命一樣，得以被分裂成更多光點、順著人和人之間的連接，飛舞到更多的人身邊。此起彼伏的光點明滅，共同照亮了整座系統(tǒng)，讓它仿佛有生命一般慢慢擴張。

圖片制作：https://wordart.com/create

這個過程聽起來或許科幻，但用來描繪推薦系統(tǒng)，怕是再恰當不過了。
推薦是一個協(xié)作與進化的過程：

對于內(nèi)容而言，每一個用戶既是消費者又是決策者，被認可的內(nèi)容得以進一步擴散，不被認可的內(nèi)容被糾偏、不至于影響更多的人。
對于用戶而言，每一次行為反饋都在不斷完善自己的用戶畫像；而系統(tǒng)的興趣探索行為，也在進一步給這幅畫像補充了更多維度。

大致了解推薦系統(tǒng)的架構(gòu)，能夠幫助我們認知到：信息是如何匹配給用戶的，而用戶的選擇又是如何影響后續(xù)的信息分發(fā)的。

作為一個工程問題，推薦系統(tǒng)的架構(gòu)與搜索系統(tǒng)的架構(gòu)具有一定的相似度：都做的是信息與用戶意圖之間的匹配。

搜索系統(tǒng)是將海量內(nèi)容與用戶表意明確的查詢相關(guān)聯(lián)，推薦系統(tǒng)則是將海量內(nèi)容與用戶沒有明確表達的偏好相關(guān)聯(lián)。

如果我們將推薦問題極度簡化：用戶只有一個愛好“NBA”時，那么推薦引擎給用戶的結(jié)果就可以近似搜索引擎在“NBA”這個搜索詞下的結(jié)果。

那么，一個簡化的搜索架構(gòu)是什么？

離線部分，專注在內(nèi)容的搜集和處理上。

搜索引擎的爬蟲系統(tǒng)會從海量網(wǎng)站上抓取原始內(nèi)容，針對搜索體系的不同要求建立索引體系。在上圖中，為了新內(nèi)容能夠更好的被用戶看到，就專門建立了時效性索引數(shù)據(jù)用于存儲幾個小時之內(nèi)的新內(nèi)容。這是一個基于關(guān)鍵詞的倒排索引，每一個關(guān)鍵詞對應(yīng)一長串提及該關(guān)鍵字的文章。比如，“教育”這個詞命中文章1、2、3；“NBA”命中了另外一批文章1、2、4。

在線部分，負責(zé)響應(yīng)用戶的搜索，完成文章的篩選、排序并最終返回給用戶。

用戶輸入一個搜索詞“NBA”，這個詞匯會首先經(jīng)過搜索詞的處理（會經(jīng)過分詞、搜索詞變換等步驟），例如“NBA”和“美職籃”是同義詞，那么在兩個詞都可以應(yīng)用在索引的查詢。

經(jīng)歷完搜索詞處理后，進入召回環(huán)節(jié)。系統(tǒng)會通過多種召回方式，從索引數(shù)據(jù)里獲得候選集合。在圖中，就分別查詢了全量的索引數(shù)據(jù)和時效性索引數(shù)據(jù)，獲得了8篇文章的集合。

在召回的候選集之上，會進行排序的步驟，通過進一步計算獲得最終結(jié)果反饋給用戶，如圖中的文章10和文章1。

用戶的點擊反饋也會影響排序環(huán)節(jié)的模型。在上圖中，用戶在展示給他的兩篇文章中只點擊了文章10，這一特征會被模型記錄以統(tǒng)計文章10和文章1在搜索詞 “NBA”下的表現(xiàn)情況。

借由搜索系統(tǒng)為參考，可以更好的理解推薦系統(tǒng)。

離線部分，同樣需要通過各種方式來獲取待推薦的內(nèi)容（用戶提交、協(xié)議同步、數(shù)據(jù)庫導(dǎo)入等）。并依據(jù)推薦引擎處理的不同維度對這些內(nèi)容進行索引處理，如話題、類目、實體詞等。在上圖中展示了兩個維度：分類維度和實體詞維度。

在線部分，其理亦然：量化用戶的請求，完成文章的篩選和排序。
推薦與搜索最大的差異，在于用戶表意的不明確性，故而，需要盡可能的完善用戶的長期畫像（對哪些類目、實體詞、話題感興趣）和短期場景（時間、地點），以此獲得用戶的意圖，從而進行意圖和內(nèi)容的匹配。

當用戶打開內(nèi)容推薦軟件時，提交給系統(tǒng)的信息如：時間、地理位置、網(wǎng)絡(luò)環(huán)境、手機設(shè)備型號、登陸用戶ID等。
基于用戶ID，推薦系統(tǒng)會取出用戶的畫像數(shù)據(jù)（User Profile）。在分類維度，用戶對體育和科技的內(nèi)容感興趣；在實體詞維度，對于NBA感興趣。
根據(jù)用戶的畫像信息，發(fā)起不同的召回過程（類目查詢和實體詞查詢），獲取各種類型的內(nèi)容構(gòu)成候選集合。
按照特定預(yù)估目標（如點擊導(dǎo)向、互動導(dǎo)向）對候選集統(tǒng)一排序，并反饋給用戶。

值得注意的是：對于推薦系統(tǒng)而言，用戶的行為不僅具有針對內(nèi)容價值評估的群體投票意義（如：某篇關(guān)于NBA的文章，偏好NBA的用戶都不點擊，那么其在“NBA”這個實體詞下應(yīng)該權(quán)重降低）同樣具有針對自身畫像的個體進化意義（如：用戶總是點擊有關(guān)于熱火隊的NBA文章，那么這個用戶的畫像中會補充“熱火”這個實體詞，影響后續(xù)他自己的推薦內(nèi)容流。）

本文被轉(zhuǎn)載1次

首發(fā)媒體

| 轉(zhuǎn)發(fā)媒體

隨意打賞

產(chǎn)品系統(tǒng)設(shè)計推薦系統(tǒng)架構(gòu)產(chǎn)品的架構(gòu)系統(tǒng)架構(gòu)

CPU上跑AI 從推薦系統(tǒng)的演進看CPU的崛起原創(chuàng)

砍柴網(wǎng) ? 1年前

作者：金旺英特爾用“芯”智生產(chǎn)力，為企業(yè)數(shù)智化轉(zhuǎn)型提供澎湃算力。在信息和數(shù)據(jù)極度繁榮的當下，人工智能正在通過各種方式影響著人類生活。其中，AI推薦系統(tǒng)作為互聯(lián)網(wǎng) 時代最關(guān)鍵的伴生技術(shù)之一，正在幫助人類梳理著各種紛繁雜亂的信息，讓資源實現(xiàn)更精準的調(diào)配，讓一切變得井然有序。推
淺論平臺推薦系統(tǒng)之惡

虎嗅網(wǎng) ? 1年前

本文來自微信公眾號：MacTalk（ID：MacTalkPro），作者：池建強，原文標題：《宣泄情緒式的表達太多了》，頭圖來自：視覺中國昨天社群里，有讀者問我寫一篇公眾號文章需要多長時間。我說拿這篇舉例子，從初稿到修改，再到后面的排版，怎么著也得兩個小時吧。這還算比較順的，因為內(nèi)容基本已經(jīng)
微美全息開發(fā)基于大數(shù)據(jù)分析模型的智能旅游推薦系統(tǒng)

砍柴網(wǎng) ? 2年前

隨著互聯(lián)網(wǎng) 的高速發(fā)展與人們的生產(chǎn)生活產(chǎn)生了高度依存的關(guān)系，在數(shù)據(jù)驅(qū)動的市場中，推薦系統(tǒng)已成為眾多互聯(lián)網(wǎng)服務(wù)的行業(yè)中不可或缺的模塊。推薦系統(tǒng)作為互聯(lián)網(wǎng)公司的強大工具，已經(jīng)在電子商務(wù)等眾多通用互聯(lián)網(wǎng)平臺的應(yīng)用程序中廣泛應(yīng)用。然而，盡管推薦系統(tǒng)采用了深度技術(shù)，例如對電子商務(wù)應(yīng)用程序中的數(shù)據(jù)流進行
微美全息開發(fā)基于多模態(tài)深度學(xué)習(xí)技術(shù)優(yōu)化視頻個性化推薦系統(tǒng)

砍柴網(wǎng) ? 2年前

隨著技術(shù)和信息社會的快速發(fā)展，現(xiàn)在獲取大量信息變得更加容易。然而，目前已經(jīng)進入一個信息過載的社區(qū)趨勢，信息過載可能導(dǎo)致更糟糕的決策，并給用戶帶來焦慮和疲勞感。推薦系統(tǒng)作為信息過濾的解決方案，可以通過個性化的內(nèi)容和服務(wù)緩解信息過載問題。在過去的十年中，推薦系統(tǒng)已成為處理信息過載的最佳方式之一。無論是在流
微美全息發(fā)布用于高效推薦系統(tǒng)的注意力自動編碼器網(wǎng)絡(luò)

砍柴網(wǎng) ? 2年前

在當今信息爆炸和資源過載的時代，個性化推薦系統(tǒng)成為幫助用戶高效獲取所需信息的重要工具。WIMI微美全息日前宣布推出一項創(chuàng)新技術(shù)——用于高效推薦系統(tǒng)的注意力自動編碼器網(wǎng)絡(luò)(Attentional Autoencoder Network for Efficient Recommendation System)，該技術(shù)將推薦
雙十一背后，藏了個價值千億的AI推薦系統(tǒng)

雷鋒網(wǎng) ? 2年前

“天空為什么是藍的？螢火蟲為什么可以發(fā)光？為什么雙眼總是一起轉(zhuǎn)動？”面對小朋友的十萬個為什么，父母、老師總會借助儲備的知識，或者查閱書籍解答疑問。但隨著內(nèi)容的爆發(fā)性增長，想要得到一個問題精準的答案難度越來越大。早年使用網(wǎng)上購物平臺的用戶，需要一步步根據(jù)商品的分類搜索，才能在海量的商品中找到適合自己的商品。2022年的雙
奇客研究顯示推薦系統(tǒng)能使用 AI 操縱人的偏好

奇客資訊 ? 2年前

「星期一」Hello Monday研究顯示推薦系統(tǒng)能使用 AI 操縱人的偏好我們所欣賞、所閱讀和所購買的很多東西是 YouTube、Twitter 和 Amazon 等網(wǎng)站通過推薦系統(tǒng)滲透到我們的意識中的。定制化的算法推薦旨在增加廣告流量、點擊或購買量。推薦系統(tǒng)有時候會讓用戶覺得算法根本不了解我們，但有
快手電商首發(fā)信任年報：信任指數(shù)納入商家推薦系統(tǒng)

砍柴網(wǎng) ? 3年前

3月4日，快手電商發(fā)布《2021快手電商信任建設(shè)年度報告》，這是快手電商自去年明確信任電商的發(fā)展戰(zhàn)略以來，首次對外系統(tǒng)性披露平臺信任生態(tài)建設(shè)和治理情況。值得注意的是，消費者信任指數(shù)被納入快手電商的商家推薦系統(tǒng)，依據(jù)多個影響消費者信任的動態(tài)指標評估結(jié)果，信任指數(shù)高的商家會得到更多流量推薦和經(jīng)營權(quán)益保障。
快手電商首次發(fā)布信任建設(shè)年報信任指數(shù)納入商家推薦系統(tǒng)

砍柴網(wǎng) ? 3年前

3月4日，快手電商發(fā)布《2021快手電商信任建設(shè)年度報告》（“下文簡稱“報告”），這是快手電商自去年明確信任電商的發(fā)展戰(zhàn)略以來，首次對外系統(tǒng)性披露平臺信任生態(tài)建設(shè)和治理情況。值得注意的是，消費者信任指數(shù)被納入快手電商的商家推薦系統(tǒng)，依據(jù)多個影響消費者信任的動態(tài)指標評估結(jié)果，信任指數(shù)高的商家會得到更多流量推薦和經(jīng)營權(quán)益保
達觀推薦系統(tǒng)助力電商行業(yè)精細化運營

產(chǎn)品壹佰 ? 3年前

伴隨著實體行業(yè)的數(shù)字化轉(zhuǎn)型，以及網(wǎng)民數(shù)量、物流快遞行業(yè)的快速增長，電商平臺之間的競爭也日趨增大。如今，電商行業(yè)已然進入創(chuàng)新發(fā)展階段，如何直面行業(yè)痛點，在眾平臺中“殺出重圍”呢？電商行業(yè)痛點多用戶對商品的需求不是單一的，如何面對不同用戶多種多樣的需求？快

評論

提交建議