欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

基于統(tǒng)計思想下的推薦系統(tǒng)-36大數(shù)據(jù)

36大數(shù)據(jù) ? 8年前掃碼分享

我是創(chuàng)始人李巖：很抱歉！給自己產(chǎn)品做個廣告，點擊進來看看。

作者：沙韜偉

我們先做如下設(shè)定：

每個用戶的打分都是獨立事件。
用戶只有兩個選擇，要么投喜歡’1’，要么投不喜歡’0’。
如果總?cè)藬?shù)為n，其中喜歡的為k，那么喜歡的比例p就等于k/n。

這是一種統(tǒng)計分布，叫做”二項分布”(binomial distribution)

理論上講，p越大應該越好，但是n的不同，導致p的可信性有差異。100個人投票，50個人投喜歡;10個人投票，6個人喜歡，我們不能說后者比前者要好。

所以這邊同時要考慮(p，n)

剛才說滿足二項分布，這里p可以看作”二項分布”中某個事件的發(fā)生概率，因此我們可以計算出p的置信區(qū)間。

所謂”置信區(qū)間”，就是說，以某個概率而言，p會落在的那個區(qū)間。

置信區(qū)間展現(xiàn)的是這個參數(shù)的真實值有一定概率落在測量結(jié)果的周圍的程度。置信區(qū)間給出的是被測量參數(shù)的測量值的可信程度，即前面所要求的“一個概率”，也就是結(jié)論的可信程度。

二項分布的置信區(qū)間有多種計算公式，最常見的是”正態(tài)區(qū)間”(Normal approximation interval)。但是，它只適用于樣本較多的情況(np > 5 且 n(1 ? p) > 5)，對于小樣本，它的準確性很差。

這邊，我推薦用t檢驗來衡量小樣本的數(shù)據(jù)，可以解決數(shù)據(jù)過少準確率不高的問題。

這樣一來，排名算法就比較清晰了：

第一步，計算每個case的p(好評率)。

第二步，計算每個”好評率”的置信區(qū)間(參考z Test或者t Test，以95%的概率來處理)。

第三步，根據(jù)置信區(qū)間的下限值，進行排名。這個值越大，排名就越高。

基于統(tǒng)計思想下的推薦系統(tǒng)-36大數(shù)據(jù)

解釋一下，n為評價數(shù)，p為好評率，z為對應檢驗對應概率區(qū)間下的統(tǒng)計量

比如t-分布：

基于統(tǒng)計思想下的推薦系統(tǒng)-36大數(shù)據(jù)

可以看到，當n的值足夠大時，這個下限值會趨向p，如果n非常小，這個下限值會大大小于p，更加符合實際。

Reddit的評論排名，目前就使用這個算法。國內(nèi)的化，滴滴也有部分業(yè)務涉及，效果也不錯。

除此之外，在計算排名的時候，我們通常會考慮三個事情

上文講到的，次數(shù)+好評率的分布，次數(shù)越多好評率越可靠，好評率越高該項越值得推薦
時間因素，如果一個項目是10天前推送的，一個項目是昨天推送的，很明顯前者的次數(shù)遠大于后者
影響權(quán)重，你這邊只考慮了喜歡和不喜歡，其實所有的排序不可能只以1個維度考慮，通常會考慮多個維度，比如瀏覽次數(shù)，搜索次數(shù)等，你需要考慮每個的重要性或者說權(quán)重大小

1這里就不講了，其他方法也有很多，比如貝葉斯平均的優(yōu)化版本、再比如經(jīng)典的Hacker公式：

2.時間因素：

時間越久，代表之前的投票結(jié)果對當前的影響越小，這邊有很多不同的影響方式，舉幾個例子：

比如艾賓浩斯遺忘規(guī)律：

這里的c、k決定下降速度，業(yè)務運用過程中，c值一般在[1,2],k值一般在[1.5,2.5]

比如時效衰減：

基于統(tǒng)計思想下的推薦系統(tǒng)-36大數(shù)據(jù)

這里就是比較常見的移動窗口式的，永遠只看近期某一段時間，而且時間內(nèi)呈線性下降，不過可以改變變化方式

3.不同種的屬性對于結(jié)果的影響自然不同

舉個例子，用戶主動搜索和用戶瀏覽相比，用戶主動搜索的情況下，用戶的需求更為強烈

通常需要判斷這些強烈程度都是通過：

相關(guān)性：看因變量與自變量之間的相關(guān)系數(shù)，如：cor函數(shù)
importance：看刪除或者修改自變量，對應變量的判斷影響大小，如：randomForest的重要性
離散程度：看自變量的數(shù)據(jù)分布是否足夠分散，是否具有判斷依據(jù)，如：變異系數(shù)或者pca等等。

End.

轉(zhuǎn)載請注明來自36大數(shù)據(jù)（36dsj.com)： 36大數(shù)據(jù) ? 基于統(tǒng)計思想下的推薦系統(tǒng)

本文被轉(zhuǎn)載1次

首發(fā)媒體

| 轉(zhuǎn)發(fā)媒體

隨意打賞

數(shù)據(jù)分析思想大數(shù)據(jù)思想大數(shù)據(jù)統(tǒng)計大數(shù)據(jù)思維基于大數(shù)據(jù)36大數(shù)據(jù)

共筑智算新高地，九章云極攜手揚州大數(shù)據(jù)集團、揚州廣陵新城投資發(fā)展集團達成戰(zhàn)略合作

砍柴網(wǎng) ? 6分鐘前

近日，由揚州市國資委、廣陵區(qū)委、區(qū)政府聯(lián)合主辦的“科創(chuàng)揚杭?商旅未來”揚州（杭州）產(chǎn)業(yè)專題招商合作交流會在杭州舉行。大會現(xiàn)場，九章云極DataCanvas公司與揚州大數(shù)據(jù)集團、揚州廣陵新城投資發(fā)展集團正式簽署戰(zhàn)略合作協(xié)議。三方將攜手打造具備高性能、高可用、高易用的
水滴信用：專業(yè)企業(yè)大數(shù)據(jù)MCP服務商提供多類型多數(shù)據(jù)維度企業(yè)信息MCP

砍柴網(wǎng) ? 21天前

當前是信息爆炸的數(shù)字經(jīng)濟時代，工商變更、司法風險、知識產(chǎn)權(quán)布局、招投標動態(tài)、經(jīng)營狀況……這些關(guān)鍵信息往往沉睡在彼此割裂的系統(tǒng)中，如何將這些流動的戰(zhàn)略資產(chǎn)看透、研究透、運用好是各行業(yè)都在思考的問題。水滴信用作為官方備案的企業(yè)征信機構(gòu)，專業(yè)的企業(yè)信息商查平臺，憑借深厚的數(shù)據(jù)底蘊與前沿的大模型技
王宏主持召開2025中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會及近期重點文體旅活動籌備工作調(diào)度會

數(shù)據(jù)觀 ? 23天前

8月24日，市委副書記、市長王宏主持召開2025中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會及近期重點文體旅活動籌備工作調(diào)度會。他強調(diào)，要深入學習貫徹習近平總書記在貴州考察時的重要講話精神，認真落實全省數(shù)字經(jīng)濟發(fā)展推進大會安排部署，科學統(tǒng)籌、精益求精、抓實抓細，全力以赴做好籌備工作，確保各項活動安全順利精彩舉辦。市人大常委會副主任劉俐莎，
2025中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會籌備工作調(diào)度會召開

數(shù)據(jù)觀 ? 1月前

8月12日，2025中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會籌備工作調(diào)度會召開。省委常委、市委書記胡忠雄主持，副省長羅強講話。省大數(shù)據(jù)局局長朱宗堯，省委宣傳部副部長、省政府新聞辦主任陳本榮，省外事辦黨組成員、省對外友協(xié)專職副會長蔣紅，省大數(shù)據(jù)局黨組成員、省信息中心黨委書記焦德祿，市領(lǐng)導劉本立、劉俐莎、付濤參加。胡忠雄指出，數(shù)博會籌備工
賣家精靈8月底將亮相長沙&鄭州跨境展會，以AI+大數(shù)據(jù)賦能華中跨境新機遇！

樂購科技 ? 1月前

用AI賦能選品決策，用定制水傳遞品牌溫度，賣家精靈始終與跨境賣家并肩同行。據(jù)悉，8月底跨境電商行業(yè)將迎來兩場重量級盛會——2025中國（鄭州）國際跨境電商展覽會和湖南（長沙）跨境電商交易會。作為亞馬遜官方認證的SPN/TSPN服務商，賣家精靈將深度參與這兩場展會，為現(xiàn)場賣家?guī)碜钚翧I功能、數(shù)據(jù)化運營解決方案及行業(yè)趨勢
每日互動AI一體機GAI Station：安全融合大模型與大數(shù)據(jù) 高效驅(qū)動企業(yè)業(yè)務增長

砍柴網(wǎng) ? 1月前

當前，大模型從技術(shù)熱點邁向產(chǎn)業(yè)應用，真正的挑戰(zhàn)浮出水面：高昂的私有化部署成本令人卻步，云端調(diào)用又使敏感數(shù)據(jù)如履薄冰。企業(yè)渴望深度融入大模型能力，卻常遭遇“水土不服”。如何將海量、分散的企業(yè)數(shù)據(jù)安全高效地轉(zhuǎn)化為智能生產(chǎn)力？每日互動推出GAI Station個知·智能工作站，基于20年數(shù)據(jù)智能服務經(jīng)驗與行業(yè)Know-How
每日互動聯(lián)手濟南大數(shù)據(jù)集團共筑數(shù)據(jù)要素安全流通新生態(tài)

砍柴網(wǎng) ? 2月前

7月7日,每日互動股份有限公司與濟南大數(shù)據(jù)集團有限公司正式簽署戰(zhàn)略合作協(xié)議,在共建濟南城市可信數(shù)據(jù)空間,打造“濟南發(fā)數(shù)站”,推動數(shù)據(jù)要素市場化運營等方面達成戰(zhàn)略合作。濟南能源集團黨委書記、董事長兼濟南大數(shù)據(jù)集團董事長潘世英,濟南能源集團黨委委員、副總經(jīng)理兼濟南大數(shù)據(jù)集團總經(jīng)理劉英華,每日互動董事長方毅,每日互動首席數(shù)據(jù)
深挖大數(shù)據(jù)價值，共探數(shù)智新未來——2025全球數(shù)字經(jīng)濟大會大數(shù)據(jù)創(chuàng)新應用論壇成功召開

雷鋒網(wǎng) ? 2月前

雷峰網(wǎng)訊 7月2日，以“深挖大數(shù)據(jù)價值激發(fā)數(shù)字經(jīng)濟新動能”為主題的2025全球數(shù)字經(jīng)濟大會大數(shù)據(jù)創(chuàng)新應用論壇在北京國家會議中心成功召開。作為2025大會的重要組成部分，大數(shù)據(jù)創(chuàng)新應用論壇匯聚了政產(chǎn)學研用多方力量，全面圍繞人工智能驅(qū)動的大模型應用、隱私計算與數(shù)據(jù)安全治理、大數(shù)據(jù)賦能產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型等議題展開深入研討，為構(gòu)
重磅發(fā)布 | 城農(nóng)商數(shù)字化指南：擁抱AI+大數(shù)據(jù)，7天裝上營銷大腦！

砍柴網(wǎng) ? 2月前

此前，中國人民銀行等七部門聯(lián)合印發(fā)《推動數(shù)字金融高質(zhì)量發(fā)展行動方案》，明確指出要以數(shù)據(jù)要素和數(shù)字技術(shù)為關(guān)鍵驅(qū)動，加快推進金融機構(gòu)數(shù)字化轉(zhuǎn)型，2027年底基本建成與數(shù)字經(jīng)濟發(fā)展高度適應的金融體系，金融機構(gòu)數(shù)字化轉(zhuǎn)型取得積極成效，數(shù)字化經(jīng)營管理能力明顯增強。
中國—上合組織大數(shù)據(jù)合作中心“中國廣州數(shù)字技術(shù)培訓基地”落戶Coremail

砍柴網(wǎng) ? 2月前

6月17日，中國—上海合作組織數(shù)字技術(shù)合作發(fā)展論壇在新疆維吾爾自治區(qū)克拉瑪依市舉行。來自中國及上合組織國家的政府官員、專家學者和企業(yè)代表等參與，與會嘉賓共同探討數(shù)字技術(shù)發(fā)展新路徑，為上合組織國家數(shù)字化合作擘畫藍圖。論壇上，中國—上海合作組織大數(shù)據(jù)合作中心正式授牌設(shè)立“哈薩克斯坦數(shù)字技術(shù)交流基地”“中國廣州數(shù)字技術(shù)培訓基
CPU上跑AI 從推薦系統(tǒng)的演進看CPU的崛起原創(chuàng)

砍柴網(wǎng) ? 1年前

作者：金旺英特爾用“芯”智生產(chǎn)力，為企業(yè)數(shù)智化轉(zhuǎn)型提供澎湃算力。在信息和數(shù)據(jù)極度繁榮的當下，人工智能正在通過各種方式影響著人類生活。其中，AI推薦系統(tǒng)作為互聯(lián)網(wǎng) 時代最關(guān)鍵的伴生技術(shù)之一，正在幫助人類梳理著各種紛繁雜亂的信息，讓資源實現(xiàn)更精準的調(diào)配，讓一切變得井然有序。推
淺論平臺推薦系統(tǒng)之惡

虎嗅網(wǎng) ? 1年前

本文來自微信公眾號：MacTalk（ID：MacTalkPro），作者：池建強，原文標題：《宣泄情緒式的表達太多了》，頭圖來自：視覺中國昨天社群里，有讀者問我寫一篇公眾號文章需要多長時間。我說拿這篇舉例子，從初稿到修改，再到后面的排版，怎么著也得兩個小時吧。這還算比較順的，因為內(nèi)容基本已經(jīng)
微美全息開發(fā)基于大數(shù)據(jù)分析模型的智能旅游推薦系統(tǒng)

砍柴網(wǎng) ? 2年前

隨著互聯(lián)網(wǎng) 的高速發(fā)展與人們的生產(chǎn)生活產(chǎn)生了高度依存的關(guān)系，在數(shù)據(jù)驅(qū)動的市場中，推薦系統(tǒng)已成為眾多互聯(lián)網(wǎng)服務的行業(yè)中不可或缺的模塊。推薦系統(tǒng)作為互聯(lián)網(wǎng)公司的強大工具，已經(jīng)在電子商務等眾多通用互聯(lián)網(wǎng)平臺的應用程序中廣泛應用。然而，盡管推薦系統(tǒng)采用了深度技術(shù)，例如對電子商務應用程序中的數(shù)據(jù)流進行
微美全息開發(fā)基于多模態(tài)深度學習技術(shù)優(yōu)化視頻個性化推薦系統(tǒng)

砍柴網(wǎng) ? 2年前

隨著技術(shù)和信息社會的快速發(fā)展，現(xiàn)在獲取大量信息變得更加容易。然而，目前已經(jīng)進入一個信息過載的社區(qū)趨勢，信息過載可能導致更糟糕的決策，并給用戶帶來焦慮和疲勞感。推薦系統(tǒng)作為信息過濾的解決方案，可以通過個性化的內(nèi)容和服務緩解信息過載問題。在過去的十年中，推薦系統(tǒng)已成為處理信息過載的最佳方式之一。無論是在流
微美全息發(fā)布用于高效推薦系統(tǒng)的注意力自動編碼器網(wǎng)絡(luò)

砍柴網(wǎng) ? 2年前

在當今信息爆炸和資源過載的時代，個性化推薦系統(tǒng)成為幫助用戶高效獲取所需信息的重要工具。WIMI微美全息日前宣布推出一項創(chuàng)新技術(shù)——用于高效推薦系統(tǒng)的注意力自動編碼器網(wǎng)絡(luò)(Attentional Autoencoder Network for Efficient Recommendation System)，該技術(shù)將推薦
雙十一背后，藏了個價值千億的AI推薦系統(tǒng)

雷鋒網(wǎng) ? 2年前

“天空為什么是藍的？螢火蟲為什么可以發(fā)光？為什么雙眼總是一起轉(zhuǎn)動？”面對小朋友的十萬個為什么，父母、老師總會借助儲備的知識，或者查閱書籍解答疑問。但隨著內(nèi)容的爆發(fā)性增長，想要得到一個問題精準的答案難度越來越大。早年使用網(wǎng)上購物平臺的用戶，需要一步步根據(jù)商品的分類搜索，才能在海量的商品中找到適合自己的商品。2022年的雙
奇客研究顯示推薦系統(tǒng)能使用 AI 操縱人的偏好

奇客資訊 ? 2年前

「星期一」Hello Monday研究顯示推薦系統(tǒng)能使用 AI 操縱人的偏好我們所欣賞、所閱讀和所購買的很多東西是 YouTube、Twitter 和 Amazon 等網(wǎng)站通過推薦系統(tǒng)滲透到我們的意識中的。定制化的算法推薦旨在增加廣告流量、點擊或購買量。推薦系統(tǒng)有時候會讓用戶覺得算法根本不了解我們，但有
快手電商首發(fā)信任年報：信任指數(shù)納入商家推薦系統(tǒng)

砍柴網(wǎng) ? 3年前

3月4日，快手電商發(fā)布《2021快手電商信任建設(shè)年度報告》，這是快手電商自去年明確信任電商的發(fā)展戰(zhàn)略以來，首次對外系統(tǒng)性披露平臺信任生態(tài)建設(shè)和治理情況。值得注意的是，消費者信任指數(shù)被納入快手電商的商家推薦系統(tǒng)，依據(jù)多個影響消費者信任的動態(tài)指標評估結(jié)果，信任指數(shù)高的商家會得到更多流量推薦和經(jīng)營權(quán)益保障。
快手電商首次發(fā)布信任建設(shè)年報信任指數(shù)納入商家推薦系統(tǒng)

砍柴網(wǎng) ? 3年前

3月4日，快手電商發(fā)布《2021快手電商信任建設(shè)年度報告》（“下文簡稱“報告”），這是快手電商自去年明確信任電商的發(fā)展戰(zhàn)略以來，首次對外系統(tǒng)性披露平臺信任生態(tài)建設(shè)和治理情況。值得注意的是，消費者信任指數(shù)被納入快手電商的商家推薦系統(tǒng)，依據(jù)多個影響消費者信任的動態(tài)指標評估結(jié)果，信任指數(shù)高的商家會得到更多流量推薦和經(jīng)營權(quán)益保
達觀推薦系統(tǒng)助力電商行業(yè)精細化運營

產(chǎn)品壹佰 ? 3年前

伴隨著實體行業(yè)的數(shù)字化轉(zhuǎn)型，以及網(wǎng)民數(shù)量、物流快遞行業(yè)的快速增長，電商平臺之間的競爭也日趨增大。如今，電商行業(yè)已然進入創(chuàng)新發(fā)展階段，如何直面行業(yè)痛點，在眾平臺中“殺出重圍”呢？電商行業(yè)痛點多用戶對商品的需求不是單一的，如何面對不同用戶多種多樣的需求？快

評論

提交建議