欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

Twitter數據挖掘：如何使用Python分析大數據

36大數據 ? 7年前掃碼分享

我是創始人李巖：很抱歉！給自己產品做個廣告，點擊進來看看。

作者：dogstar

大數據 無處不在。在時下這個年代，不管你喜歡與否，在運營一個成功的商業的過程中都有可能會遇到它。

本教程將會簡要介紹何謂大數據，無論你是嘗試抓住時機的商人，抑或是尋找下一個項目的編程高手，你都可以學到它是如何為你所用，以及如何使用Twitter API和Python快速開始。

Twitter數據挖掘：如何使用Python分析大數據

何謂大數據？

大數據就像它看起來那樣——有大量的數據。單獨而言，你能從單一的數據獲取的洞見窮其有限。但是結合復雜數學模型以及強大計算能力的TB級數據，卻能創造出人類無法制造的洞見。大數據分析提供給商業的價值是無形的，并且每天都在超越人類的能力。

大數據分析的第一步就是要收集數據本身，也就是眾所周知的“數據挖掘”。數據來自于四面八方。大部分的企業處理著GB級的數據，這些數據有用戶數據、產品數據和地理位置數據。在本教程中，我們將會探索如何使用數據挖掘技術收集Twitter的數據，這可能會比你想象中的更有用。

舉個例子，假設你運營著臉書，想使用Messager數據為如何更好地向用戶投放廣告提供一些見解。而Messager擁有著 12億月活躍用戶。在這個案例中，大數據就是用戶之間的對話。假設你能逐個閱讀每個用戶的對話，那么就能清楚知道他們喜歡什么，從而有針對性地向他們推薦相應的產品。使用廣為人知的自然語言處理（NLP）這一機器學習技術，你可以大型地實現這一點，并且整個過程自動化，一切交給機器即可。

這僅僅是機器學習和大數據分析為公司帶來價值的無數的示例中的一個。

為什么選擇Twitter數據？

Twitter 是一個數據金礦。不像其他的社交平臺，幾乎每個Twitter用戶的微博都是完全開放并且是可拉取的。如果你想嘗試獲取大量的數據然后對其進行分析，這是相當有幫助的。同時，Twitter的數據也是非常具體的。它的API接口允許你進行復雜的查詢，例如拉取最近20分鐘內關于指定某個話題的每一條微博，或者是拉取某個用戶非轉發的微博。

這里一個簡單的應用就是，分析大眾是怎么看待你們公司的。你可以收集提到你們公司（或者其他任何詞語）的最近2,000條微博，然后對其運行情感分析算法。

我們可以圈定具體居住在某個位置的用戶，也就是所謂的空間數據。另一個應用可以是，在地球上標志出你們公司提及次數最多的地區。

如你所見，Twitter數據是通往大眾見解的一扇大門，以及他們是如何針對某個主題進行大數據分析的。這些，結合透明度和Twitter API接口慷慨的調用次數，可以產出非凡的結果。

工具一覽

對于這些示例，我們將使用 Python 2.7。理想情況下，你應該有一個編寫代碼的IDE。我使用的是 PyCharm – 社區版。

為了連接Twitter的API接口，將會用到叫做 Tweepy 的類庫，這個類庫稍微安裝一下就可以了。

入門指南

Twitter開發者賬號

為了使用Twitter的API接口，需要先在 Twitter應用站點上創建一個開發者賬號。

1、登錄或者在 https://apps.twitter.com/
2、創建一個新的應用（可點擊右上角的按鈕）
3、在創建應用的頁面填寫上唯一的名字，網站名字（如果沒有可以使用默認值），和項目描述。接受協議和條款然后進入到下一個頁面。
- 4、一旦創建好了你項目，點擊“Keys and Access Tokens”標簽頁，應該就可以看到你使用的API secret和API key了。
- 5、你還需要一對訪問憑證?？蓾L到下面并請求這些憑證。這時頁面會進行刷新，然后就可以獲得access token和access token secret了。

稍候都要用到這些數據，所以先不要關閉這些標簽。

安裝Tweepy

Tweepy 是一個超級棒的工具，它可用于訪問Twitter API接口。支持Python 2.6，2.7，3.3，3.4，3.5,，和3.6。安裝Tweept有好兩種不同的方式，最簡單的方式就是使用 pip 。

使用pip安裝

在你的終端上簡單地輸入 pip install tweepy 即可。

使用Github安裝

可以按照 Tweepy在Github倉庫上的說明進行操作?；镜牟襟E如下：

				
					git clone https://github.com/tweepy/tweepy.git
					cd tweepy
					python setup.py install

你也可以在那解決任何安裝的問題。

認證

既然必要的工具已準備就緒，那么我們就可以開始寫代碼了！今天將要構建的每一個應用，其底線都是需要引用Tweepy來創建一個API對象，以便我們可以進行函數的調用。然而，要想創建這些API對象，首先必須先認證我們的開發者信息。

首先，導入Tweepy，并添加我們自己的認證信息。

				
					import tweepy
					consumer_key = "wXXXXXXXXXXXXXXXXXXXXXXX1"
					consumer_secret = "qXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXh"
					access_token = "9XXXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXi"
					access_token_secret = "kXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXT"

現在是時候創建API對象了。

				
					# 創建認證對象
					auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
					# 設置你的access token和access secret
					auth.set_access_token(access_token, access_token_secret)
					# 傳入auth參數，創建API對象
					api = tweepy.API(auth)

這些代碼是構建每一個應用的基礎部分，所以確保不要刪除。

示例1：你的時間軸

在這個示例中，我們將會從你的Twitter動態中拉取最新的微博。通過使用API對象的 home_timeline() 函數可以做到這一點。隨后把這些結果存在某個變量中，并循環打印。

				
					# 使用API對象獲取你的時間軸上的微博，并把結果存在一個叫做public_tweets的變量中
					public_tweets = api.home_timeline()
					# 遍歷所拉取的全部微博
					for tweet in public_tweets:
					# 打印存在微博對象中的text字段
					print tweet.text

輸出的結果可能看起來像是一堆隨機的微博，后臺跟著指向微博本身的URL。
Twitter數據挖掘：如何使用Python分析大數據

打開指向微博的鏈接，通常會把你帶到對應的微博那。例如，打開上面第一條微博中的鏈接，會看到以下這樣的結果：
Twitter數據挖掘：如何使用Python分析大數據

注意，如果你是通過終端而不是通過像PyCharm這樣的IDE來運行的話，在打印微博的text內容時有可能會遇到一些格式化的問題。

結果背后的JSON

在上面的示例中，我們使用 tweet.text 打印了每一條微博的text內容。為了參考每一個微博對象有哪些具體的屬性，不得不去看一下Twitter API接口返回的JSON數據。

從Twitter API接口接收到的結果是以JSON格式返回的，并且附有有相當多的信息。為了簡單起見，本教程主要關注每一條微博的“text”屬性，以及關于博主（即發布微博的用戶）的信息。對于上面這個例子，你可以在這里看到整個返回的JSON對象。

下面快速來看下微博中提供的部分屬性。

Twitter數據挖掘：如何使用Python分析大數據

如果想找到創建微博的時間，可以使用 print tweet.created_at 進行查詢。

你還可以看到，每一條微博都帶有博主的相關信息。
Twitter數據挖掘：如何使用Python分析大數據

要是想獲取博主的 name 和 location 屬性，可以執行 print tweet.user.screen_name 和 print tweet.user.location .

如果你的應用是基于空間數據的話，這些屬性將會非常有用。

示例2：指定某個用戶的微博

在這個示例中，我們將會拉取選中用戶的最近20條微博。

首先，查看 Tweepy 文檔，看下是否存在一個像這樣的函數。稍微調查一番，可以發現 user_timeline() 函數正是我們想要的。
Twitter數據挖掘：如何使用Python分析大數據

可以看到， user_timeline() 函數有一些能夠用到的重要參數，特別是 id （用戶的ID）和 count （待拉取的微博數量）。注意，由于 Twitter的頻率限制，每次查詢只能拉取一定數量的微博。

讓我們來拉取Twitter賬號@NyTimes的最近20條微博。
Twitter數據挖掘：如何使用Python分析大數據

我們可以創建變量來存放待拉取的微博數量（即count），以及待拉取的用戶（即name）。然后用這兩個參數調用 user_timeline() 函數。下面是更新后的代碼（注意，在代碼的頂部應該保持認證和API對象的創建）。

				
					# 傳入認證信息，并創建API對象
					api = tweepy.API(auth)
					# 待拉取微博的用戶
					name = "nytimes"
					# 待拉取的微博數量
					tweetCount = 20
					# 使用上面的參數，調用user_timeline函數
					results = api.user_timeline(id=name, count=tweetCount)
					# 遍歷所拉取的全部微博
					for tweet in results:
					# 打印存在微博對象中的text字段
					print tweet.text

輸出的結果看起來像這樣：

Twitter數據挖掘：如何使用Python分析大數據

這種類型數據的流行應用包括有：

對指定的用戶進行分析，分析他們是如何與世界進行互動的
尋找Twitter的影響者并分析他們的粉絲的趨勢和互動情況
監控某個用戶的粉絲的變化情況

示例3：使用關鍵字查找微博

這是最后一個示例：獲取包含某個關鍵字的最新的微博。如果想在Twitter世界中監控某個話題，或者甚至想看下你的商業被提到的情況，這都是相當有用的。假設現在想看下Twitter談論Toptal的情況怎樣。

翻閱完 Tweept文檔， search() 函數似乎是完成我們目標的最佳工具。

Twitter數據挖掘：如何使用Python分析大數據

這里最重要的參數是 q ——查詢參數，即要查找的關鍵字。

還可以設置 lang 參數，這樣就只會取到想要的語言的微博。這里只返回英文（“en”）的微博。

現在可以修改代碼，以體現要做的改變。首先創建存放參數（query和language）的變量，然后通過API對象調用相應的函數。最后在循環中也打印了發布微博的用戶的終端名稱。

				
					# 傳入認證信息，并創建API對象
					api = tweepy.API(auth)
					# 你想查找的關鍵字
					query = "Toptal"
					# 語言代碼（遵循ISO 639-1標準）
					language = "en"
					# 使用上面的參數，調用user_timeline函數
					results = api.search(q=query, lang=language)
					# 遍歷所拉取的全部微博
					for tweet in results:
					# 打印存在微博對象中的text字段
					print tweet.user.screen_name,"Tweeted:",tweet.text

最后結果看起來像是這樣：

Twitter數據挖掘：如何使用Python分析大數據

以下是使用這些信息的一些實用途徑：

創建空間圖表，查看你們公司在世界哪些地方被提到最多
對微博進行情感分析，看下關于你們公司的整體意見是正面還是負面
創建關于發布你們公司或者產品相關微博中最熱門的用戶的社交圖表

在后續的文章中，會覆蓋到部分這些主題。

結論

Twitter的API接口在數據挖掘應用中非常有用，并且關于公眾的意見能提供大量的見解。如果Twitter API接口和大數據分析是你未來會感興趣的東西，建議查看 Twitter API接口， Tweepy 和 Twitter的頻率限制指南以獲取更多信息。

在本教程，我們只是簡單地講了基本的訪問和拉取。然而，Twitter的API接口還可用來服務于錯綜復雜的大數據問題，涉及人，趨勢，和非常復雜以致單憑人類心智無法掌控的社交圖。

End.

轉載請注明來自36大數據（36dsj.com)： 36大數據 ? Twitter數據挖掘：如何使用Python分析大數據

隨意打賞

python 數據挖掘 python數據分析 twitter是什么 twitter數據 twitter營銷 twitter注冊 twitter 大數據分析

我來數科：通過大數據與人工智能技術打造安全便捷的金融服務平臺

砍柴網 ? 3分鐘前

在金融科技加速變革下，風控體系成為金融機構發展的關鍵支撐。隨著監管政策趨嚴，個人信息保護、數據安全、機構合規性等要求不斷提升，促使行業進一步加強風控體系的構建與升級。我來數科作為深耕金融科技領域的平臺，始終走在風控技術前沿，以大數據和人工智能為核心，打造全方位的風險管理體系，為用
市場監管總局回應大數據殺熟

i黑馬 ? 3天前

3月5日，國家市場監督管理總局局長羅文表示，今年將著力優化監管方式方法，大力促進平臺經濟健康發展。當前，外賣騎手等新就業群體和消費者都反映，平臺企業存在三個問題。一是算法不透明，二是大數據殺熟，三是刷單炒信。針對上述問題，市場監管部門將積極配合有關部門，加強綜合治理，督促平臺企業提高算法透明度，優化算法規則，切實有力地
貴陽市大數據局舉辦貴陽貴安DeepSeek大模型專題培訓

數據觀 ? 4天前

為全面提升貴陽貴安數治能力和水平，建設更高水平的數字貴陽貴安，推動人工智能賦能在全省走前列、作表率。3月4日，貴陽市大數據局舉辦貴陽貴安DeepSeek大模型專題培訓，邀請貴州大數據集團云智事業部副總經理陸嘉達博士作“大模型DeepSeek的技術與應用”專題培訓。貴陽市大數據局副局長徐先文主持會議，各區（市、縣、開發區
白鴿在線攜手鹽城大數據集團以科技守護百姓財產安全

砍柴網 ? 6天前

信息化時代,電信網絡詐騙案件持續多發高發,手段日益復雜、新騙術層出不窮,給人民群眾的財產安全帶來了巨大威脅,加強反詐宣傳工作亟不可待。為守護百姓的“錢袋子”,近日, 白鴿在線聯合鹽城市大數據集團、鹽城市公安局鹽南分局及華農財險,共同發起“數智反詐守護幸?！贝笮头丛p公益項目 ,攜手構建“政企保
醫渡科技六度蟬聯醫療大數據企業榜首，以“YiduCore+DeepSeek”重構醫療智能生態

砍柴網 ? 6天前

近日,《2024醫療大數據企業排行榜》發布,醫渡科技連續第六年摘得行業榜首桂冠,再次證明了其在中國醫療人工智能和大數據領域的優勢地位。該榜單由中國科學院主管的權威媒體《互聯網周刊》聯合德本咨詢、中國社會科學院信息化研究中心每年評選,具有極高的權威性和
高質量訓練集助力研究第七屆傳播數據挖掘競賽喊你報名！

砍柴網 ? 1分鐘前

對于大模型而言，數據集作為機器學習和統計建模的基礎，是算法學習所需的“食材”。而對于智能與計算傳播學專業的師生而言，高質量的數據集是前沿課題研究中不可或缺的基礎資源。由中國新聞史學會智能與計算傳播專委會指導，中央民族大學新聞與傳播學院、微熱點研究院聯
加和科技受邀出席中國信通院“卓信大數據計劃”2025年度會議

砍柴網 ? 11天前

2025年2月21日，中國信通院“卓信大數據計劃”2025年度會議在北京召開。加和科技作為特邀參展商參會，與行業精英共同聚焦大模型時代的數據安全挑戰與機遇。自2021年啟動以來，“卓信大數據計劃”致力于構建數據安全基礎設施，完善保障體系，匯聚產業力量，推動應用創新。此次大
2025中國國際大數據產業博覽會年度主題征集公告

數據觀 ? 11天前

中國國際大數據產業博覽會（以下簡稱數博會），是全球首個以大數據為主題的國際性博覽會，由國家數據局主辦，貴州省人民政府承辦，經過十年積累沉淀，已經成為數據領域引領創新趨勢、展示行業成果、促進開放合作的重要載體。2025數博會籌備工作已啟動，為全方位展現本屆數博會國際性、權威性平臺形象，提高大眾參與度，現面向全社會公開征集
“浪潮卓數大數據”完成B輪融資

i黑馬 ? 1月前

據浪潮卓數消息，“浪潮卓數大數據”宣布完成B輪融資。本輪融資由中泰創投領投，東營財金、浪潮產投等機構跟投，公司估值較上輪增長167%。本次融資將助力浪潮卓數大數據進一步加強研發投入、引進優秀人才、塑造產業優勢，加快科技創新成果轉化。文章評價匿名用戶發布發布
酷克數據榮膺多項行業大獎，引領大數據與計算產業創新發展

砍柴網 ? 1月前

新年伊始，酷克數據在大數據與計算產業領域捷報頻傳，榮譽入選第八屆大數據“星河(Galaxy)”數據庫潛力案例，更被權威收錄入《2024年度全球計算產業案例匯編(GMVPS)》，彰顯實力。同時，酷克數據還榮膺IT168頒發的2024年度技術卓越獎，以及InfoQ授予的2024年度技術生態構建品牌殊榮。這一系列輝煌榮譽，不
云知聲 Atlas 超算平臺入選《分布式統一大數據虛擬文件系統Alluxio原理、技術與實踐》

砍柴網 ? 2月前

在大數據與人工智能領域日新月異的今天，高效、可靠的分布式文件系統及其計算加速方案已成為眾多企業和科研機構關注的焦點。云知聲的Atlas超算平臺以其“基于Fluid + Alluxio的計算加速實踐”，榮耀入選《分布式統一大數據虛擬文件系統Alluxio原理、技術與實踐》。這一榮譽不僅彰顯了云知聲在技術創新方面的實力，也
馬斯克玩壞了 X，2000 萬「Twitter 難民」瘋狂涌向這個 App

極客公園 ? 15天前

作者｜Moonshot編輯｜靖宇?如果現在讓你叫出 X 的兩大明星用戶，你會想到誰？特朗普和馬斯克或許是很多人的答案。X 上關注者排名，特朗普和馬斯克是前十名里活躍度最高的用戶｜圖源：Wikipedia?特朗普回白宮，X 和他的第一哥們馬斯克都出了不少力。當年因看不慣其他社交媒體的「政治正確」，看不慣特朗普被 Twit
廣告主聯合抵制Twitter，馬斯克祭出反壟斷法有用嗎？

虎嗅網 ? 4月前

據媒體報道，被馬斯克收購的X平臺近日以串謀違法壟斷為由起訴了世界廣告主聯合會和聯合利華、瑪氏等多個跨國公司，指控他們非法抵制了X平臺及其前身Twitter，串謀扣留數十億美元的廣告收入。看到此案，筆者眼前一亮，馬斯克的律師真是打到廣告主們的七寸了。案情簡介：世界廣告主聯合會（WFA）和聯合
放棄 TikTok 和 Twitter 吧，Z時代想要的社交媒體來了

極客公園 ? 5月前

7 月 3 日，新社交媒體平臺 noplace 宣布開啟邀請模式，隨機在 App Store 社交板開始沖榜。上個月還有近 50 萬用戶在候補邀請名單上。noplace:make new friends | 圖源：App Storenoplace 的特色十分明顯，用大膽的多巴胺系配色設計，摒棄了視頻和圖像內容，基于文本
馬斯克收購Twitter后：營收下滑40%，季度虧損4.5億美元

i黑馬 ? 6月前

據財聯社，最新的監管文件顯示，特斯拉CEO埃隆·馬斯克接手Twitter（已更名為X）后，公司的營收顯著下滑，主要因為廣告主紛紛被馬斯克的激進措施所嚇跑。根據X提交給監管部門的最新文件，自馬斯克接手以來，X的收入確實大幅下降。在2023年的前六個月，這也是馬斯克接手X后的第一個完整年度，X的營收為14.8億美元，同比下
馬斯克又遭Twitter前高管起訴，索賠375萬美元遣散費

i黑馬 ? 6月前

據新浪財經，根據本月早些時候向加州北區地方法院提起的一項訴訟，Twitter前首席會計官（CAO）Robert Kaiden正在起訴馬斯克，要求他支付375萬美元的未付遣散費。Kaiden在起訴書中稱，在2022年10月收購Twitter后，馬斯克錯誤地指控他和其他Twitter高管存在不當行為，無故解雇他們，并避免支
紐交所故障，巴菲特股票暴跌 99%；蘋果 WWDC 直播邀請曝光；Twitter 正式允許成人內容存在

極客公園 ? 6月前

紐交所技術故障：巴菲特旗下伯克希爾哈撒韋 A 類股跌 99%6 月 3 日晚間，紐約證券交易所因技術故障導致部分股票價格顯示異常，導致沃倫巴菲特 (Warren Buffett) 旗下伯克希爾哈撒韋公司 (Berkshire Hathaway) 的 A 類股票似乎下跌了近 99%。據報道，在開盤后不久，紐約證券交易所便
讓 Altman 也玩上癮的「語音 Twitter」，在硅谷徹底火了

極客公園 ? 7月前

在后移動互聯網時代，已經越來越難看到 App 在產品層面上的創新，Airchat 帶來了一點新意。過去一段時間，這款僅限邀請注冊的 App 在風險投資人、科技公司高管以及其他硅谷名人中流行了起來。簡言之，Airchat 可被視為 Twitter 的語音化版本，它重新定義了社交媒體上的互動方式。在這里，你可以像其他任何社
第六屆傳播數據挖掘競賽報名通道開啟！

砍柴網 ? 1年前

由浙江工業大學與微熱點研究院聯合舉辦的第六屆傳播數據挖掘競賽正式啟動。報名截止時間為4月25日，感興趣的團隊可要抓緊時間報名啦！自2018年創辦至今，傳播數據挖掘競賽已舉辦五屆，吸引了來自北京大學、清華大學、復旦大學、帝國理工學院、哥倫比亞大學等國內外名校近600個團隊、2300余名學生參與。隨著參賽團隊數量的增加、覆
馬斯克收購Twitter一周年：“X”能成為第二個微信？

虎嗅網 ? 1年前

根據媒體報道，Twitter收購一周年之際，馬斯克在內部會議上告知X全體員工， X預計在2024年底推出針對個人金融服務的相關功能，并表示使用者將“不再需要銀行賬戶”，“這些功能會強大到，讓用戶大吃一驚”。 X首席執行官琳達·亞卡里諾（Linda Yaccarino）表示，
馬斯克收購Twitter滿一年，為其提供貸款的銀行將遭受近20億美元的損失

砍柴網 ? 1年前

10月27日消息，在特斯拉首席執行官埃隆·馬斯克（Elon Musk）去年同意斥資440億美元收購X（前身為推特）時，美國多家銀行向其提供了130億美元貸款。然而短短一年后，這些銀行準備拋售這些債務，哪怕為此承受20億美元的損失也在所不惜。2022年10月，包括摩根士丹利、美國銀行以及巴克萊等七家銀行共同向馬斯克提供了
Twitter在蘋果應用商店已更名為X

砍柴網 ? 1年前

7 月 31 日消息，Twitter 應用今日在蘋果App Store 已經更名為 X，這意味著該公司可能獲得了蘋果的特批，因為此前 App Store 明確規定應用名稱至少需要兩個字母。 IT之家此前報道，在馬斯克的力主之下，Twitter（推特）近日已經全面開啟了改名進程，目前 iOS、A
微美全息開發基于數據挖掘和神經網絡的數據分析與監測算法系統

砍柴網 ? 2年前

近年來，互聯網及其相關技術促進了計算機、網絡和通信的整合，數據處理總量越來越大，各產業的信息化程度越來越高，社會的數據化趨勢越來越明顯。面對海量數據，決策者很難直接從中提取有價值的知識，這導致對數據分析工具的強烈需求。數據挖掘是信息技術自然演進產生的高級數據分析工具。數據挖掘是從龐
微美全息開發基于人工神經網絡的數據挖掘聚類算法系統

砍柴網 ? 2年前

互聯網數據量呈爆炸式增長，數據對社會生產和生活的影響越來越大，數據挖掘技術的應用也越來越廣泛。數據挖掘過程是一個反復多次的人機交互過程，它包括定義問題、建立數據挖掘庫、分析數據、準備數據、建立模型、評估模型等。主要的數據挖掘算法包括關聯分析、序列模式挖掘、分類算法及聚類算法等。據了解，WIMI微美全息
容聯云知識圖譜Demo論文被數據挖掘頂級國際會議CIKM 2022錄用

砍柴網 ? 2年前

近日，信息檢索和數據挖掘領域的國際頂級學術會議CIKM公布了2022年Demo論文的錄用結果，容聯云人工智能實驗室（Cloopen Research）與南開大學合作的論文《DASH: An Agile Knowledge Graph System Disentangling Demands, Algorithms, D
干貨分享：數據挖掘淺談

人人都是產品經理 ? 3年前

編輯導讀：數據挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的數據中通過算法搜索隱藏于其中信息的過程。本文作者圍繞數據挖掘展開分析，希望對你有幫助。豆豆和花花開了一家鮮花店。豆豆跟花花說：“情人節快到了，咱店都需要準備哪類情人節花束？每類花束需要準備多少？……” 花花回答道，“根據顧客分類，大致分為自信示愛、甜蜜上
中山大學聯合創鄰科技Galaxybase破萬億數據挖掘世界記錄

砍柴網 ? 3年前

數字經濟時代，數據成為關鍵生產要素。企業從海量數據中挖掘商業價值的需求越發迫切。但這些高維、異構、復雜關聯的數據給傳統大數據處理和關系型數據庫產品帶來了極大挑戰。中山大學聯合創鄰科技 “Galaxybase”圖數據庫，完成了萬億規模交易數據智能挖掘性能
數據挖掘頂會ICDM 2021獎項出爐：華人包攬頭獎，張成奇獲杰出服務獎

雷鋒網 ? 3年前

作者?| 王曄編輯 | 青暮近日，ICDM 2021公布了研究貢獻獎、杰出服務獎、10年最具影響力論文獎、最佳論文獎、最佳學生論文獎、DEI獎等多項大獎。其中，華人學者獲得包括杰出服務獎、最佳論文獎、最佳學生論文在內的眾多獎項！IEEE ?ICDM（全稱IEEE International Co
四種方法，用數據挖掘潛力用戶

人人都是產品經理 ? 3年前

編輯導語：如何才能高效地挖掘潛力用戶？現有的數據可以告訴我們用戶現狀如何，但這些表示現狀的數據卻不能成為我們判斷“潛力”的標準。那么我們如何利用數據分析來判斷潛力用戶？本文作者便總結了用數據挖掘潛力用戶的方法操作，一起來看一下?！巴诰蛞幌?，哪些客戶有潛力”是很多同學在日常工作中老大難問題。到底怎么算是有潛力？又該怎么用
數據挖掘國際頂會KDD 2021收錄結果公布百度多篇論文入選

砍柴網 ? 3年前

8月14日至18日，國際數據挖掘與知識發現大會?KDD?2021在線上正式舉行。此前本屆KDD入選論文已經揭曉，百度被收錄的多篇論文，其突出的特點是學術研究與技術應用緊密結合，再次展現百度在AI領域的技術實力。ACM?SIGKDD（簡稱KDD）國際數據挖掘與知識發現大會至今已連續舉辦了26屆，是世界數據挖掘最高級別的學