欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

關鍵七步，用Apache Spark構建實時分析Dashboard

36大數據 ? 8年前掃碼分享

我是創始人李巖：很抱歉！給自己產品做個廣告，點擊進來看看。

作者 | Abhinav ?譯者：王慶

摘要：本文我們將學習如何使用Apache Spark streaming，Kafka，Node.js，Socket.IO和Highcharts構建實時分析Dashboard。

問題描述

電子商務門戶希望構建一個實時分析儀表盤，對每分鐘發貨的訂單數量做到可視化，從而優化物流的效率。

解決方案

解決方案之前，先快速看看我們將使用的工具：

Apache Spark – 一個通用的大規模數據快速處理引擎。Spark的批處理速度比Hadoop MapReduce快近10倍，而內存中的數據分析速度則快近100倍。更多關于Apache Spark的信息。

Python – Python是一種廣泛使用的高級，通用，解釋，動態編程語言。更多關于Python的信息。

Kafka – 一個高吞吐量，分布式消息發布訂閱系統。更多關于Kafka的信息。

Node.js – 基于事件驅動的I/O服務器端JavaScript環境，運行在V8引擎上。更多關于Node.js的信息。

Socket.io – Socket.IO是一個構建實時Web應用程序的JavaScript庫。它支持Web客戶端和服務器之間的實時、雙向通信。

Highcharts – 網頁上交互式JavaScript圖表。更多關于Highcharts的信息。

CloudxLab – 提供一個真實的基于云的環境，用于練習和學習各種工具。你可以通過在線注冊立即開始練習。

如何構建數據Pipeline?

下面是數據Pipeline高層架構圖

關鍵七步，用Apache Spark構建實時分析Dashboard

我們的實時分析Dashboard將如下所示 36大數據（http://www.36dsj.com/）

關鍵七步，用Apache Spark構建實時分析Dashboard

實時分析Dashboard

讓我們從數據Pipeline中的每個階段的描述開始，并完成解決方案的構建。

階段1

當客戶購買系統中的物品或訂單管理系統中的訂單狀態變化時，相應的訂單ID以及訂單狀態和時間將被推送到相應的Kafka主題中。

數據集 36大數據（http://www.36dsj.com/）

由于沒有真實的在線電子商務門戶網站，我們準備用CSV文件的數據集來模擬。讓我們看看數據集：

關鍵七步，用Apache Spark構建實時分析Dashboard

數據集包含三列分別是：“DateTime”、“OrderId”和“Status”。數據集中的每一行表示特定時間時訂單的狀態。這里我們用“xxxxx-xxx”代表訂單ID。我們只對每分鐘發貨的訂單數感興趣，所以不需要實際的訂單ID。

可以從CloudxLab GitHub倉庫克隆完整的解決方案的源代碼和數據集。

數據集位于項目的spark-streaming/data/order_data文件夾中。

推送數據集到Kafka

shell腳本將從這些CSV文件中分別獲取每一行并推送到Kafka。推送完一個CSV文件到Kafka之后，需要等待1分鐘再推送下一個CSV文件，這樣可以模擬實時電子商務門戶環境，這個環境中的訂單狀態是以不同的時間間隔更新的。在現實世界的情況下，當訂單狀態改變時，相應的訂單詳細信息會被推送到Kafka。

運行我們的shell腳本將數據推送到Kafka主題中。登錄到CloudxLab Web控制臺并運行以下命令。

關鍵七步，用Apache Spark構建實時分析Dashboard

階段2 36大數據（http://www.36dsj.com/）

在第1階段后，Kafka“order-data”主題中的每個消息都將如下所示

階段3

Spark streaming代碼將在60秒的時間窗口中從“order-data”的Kafka主題獲取數據并處理，這樣就能在該60秒時間窗口中為每種狀態的訂單計數。處理后，每種狀態訂單的總計數被推送到“order-one-min-data”的Kafka主題中。

請在Web控制臺中運行這些Spark streaming代碼

關鍵七步，用Apache Spark構建實時分析Dashboard

階段4

在這個階段，Kafka主題“order-one-min-data”中的每個消息都將類似于以下JSON字符串

關鍵七步，用Apache Spark構建實時分析Dashboard

階段5 36大數據（http://www.36dsj.com/）

運行Node.js server

現在我們將運行一個node.js服務器來使用“order-one-min-data”Kafka主題的消息，并將其推送到Web瀏覽器，這樣就可以在Web瀏覽器中顯示出每分鐘發貨的訂單數量。

請在Web控制臺中運行以下命令以啟動node.js服務器

關鍵七步，用Apache Spark構建實時分析Dashboard

現在node服務器將運行在端口3001上。如果在啟動node服務器時出現“EADDRINUSE”錯誤，請編輯index.js文件并將端口依次更改為3002…3003…3004等。請使用3001-3010范圍內的任意可用端口來運行node服務器。

用瀏覽器訪問

啟動node服務器后，請轉到http://YOUR_WEB_CONSOLE:PORT_NUMBER訪問實時分析Dashboard。如果您的Web控制臺是f.cloudxlab.com，并且node服務器正在端口3002上運行，請轉到http://f.cloudxlab.com:3002訪問Dashboard。

當我們訪問上面的URL時，socket.io-client庫被加載到瀏覽器，它會開啟服務器和瀏覽器之間的雙向通信信道。

階段6

一旦在Kafka的“order-one-min-data”主題中有新消息到達，node進程就會消費它。消費的消息將通過socket.io發送給Web瀏覽器。

階段7

一旦web瀏覽器中的socket.io-client接收到一個新的“message”事件，事件中的數據將會被處理。如果接收的數據中的訂單狀態是“shipped”，它將會被添加到HighCharts坐標系上并顯示在瀏覽器中。

我們還錄制了一個關于如何運行上述所有的命令并構建實時分析Dashboard的視頻。

我們已成功構建實時分析Dashboard。這是一個基本示例，演示如何集成Spark-streaming，Kafka，node.js和socket.io來構建實時分析Dashboard?，F在，由于有了這些基礎知識，我們就可以使用上述工具構建更復雜的系統。

End.

隨意打賞

hadoop spark apache spark spark 數據分析 dashboard 關鍵時刻

TECNO全新發布SPARK 20 Pro 5G，帶來5G影音娛樂全方位升級體驗

砍柴網 ? 6月前

6月17日,創新科技品牌TECNO全新發布SPARK 20 Pro 5G,為SPARK 20系列首款5G 手機。TECNO SPARK 20 Pro 5G搭載極速 5G 芯片和108MP超清主攝像頭,采用極簡“拉梅曲線(Lamé Curve)“ 相機島全新時尚設計, 全能
SPARK2024 騰訊游戲發布會：逾30款產品及多個游戲科技項目發布最新進展

砍柴網 ? 6月前

5月28日， SPARK2024 騰訊游戲發布會在線上舉行，帶來34款產品的最新動態，及“數字中軸·小宇宙”“數字藏經洞”“全動飛行模擬機視景系統”“全變源追蹤獵人星座計劃”等游戲科技項目的最新進展，旨在為用戶帶來更多元的游戲
SPARK2024騰訊游戲發布會舉辦游戲科技項目公布最新進展

砍柴網 ? 6月前

5月28日，SPARK 2024 騰訊游戲發布會在線上舉行。發布會上，在“游戲科技應用”篇章，騰訊游戲分享了“數字中軸·小宇宙”“數字藏經洞”“全動飛行模擬機視景系統”“全變源追蹤獵人星座計劃”四個項目的最新進展，展現了生發于游戲的游戲科技，在“數字文保”、“民用航空”
TECNO SPARK 20 Pro+ 斬獲2024年度法國設計獎兩項鉑金大獎

砍柴網 ? 10月前

近日,2024年度法國設計獎(French Design Awards)首批獲獎作品公布。傳音TECNO最新上市的SPARK 20 Pro+憑借其精致簡約的外觀與創新的人體工學設計,斬獲2024法國設計獎產品設計類別下的兩項鉑金大獎,分別為手機、平板電腦和可穿戴設備(Mobile Phon
Check Point 推出中小企業高級網絡安全解決方案：Quantum Spark 1900、2000

砍柴網 ? 10月前

創新型下一代防火墻可提供高達 5 Gbps 的增強型 AI 威脅防御性能，對零日惡意軟件、網絡釣魚和勒索軟件的攔截率高達 99.8%2024 年 2 月，領先的云端 AI 網絡安全平臺提供商?Check Point? 軟件技術有限公司（納斯達克股票代碼：CHKP）宣布推出 Check Point Quantum Sp
Check Point推出 Infinity Spark，通過企業級防護和連接能力保護中小型企業

砍柴網 ? 1年前

Check Point Infinity Spark 在一個簡單的平臺上跨網絡、電子郵件、辦公室、端點及移動設備提供行業領先的威脅防御2023 年 2 月 ,全球領先的網絡安全解決方案提供商 Check Point 軟件技術有限公司（納斯達克股票代碼：CHKP）今日宣布推出 Check Point Infinity S
騰訊游戲開發首個虛擬探索空間《代號：Spark》，“內測”版本亮相ChinaJoy

砍柴網 ? 2年前

作為全球數字娛樂領域最具知名度和影響力的年度盛會之一，2022年的ChinaJoy成為國內首個試水元宇宙的游戲展。 8月27日，騰訊游戲開發的首個以品牌logo命名的虛擬探索空間“代號：Spark”亮相本次ChinaJoy線上展。騰訊游戲以“Spark?無限”為理念，并將“∞”符合融
背靠億級流量，SPARK2022騰訊先鋒打造云游戲互動直播

砍柴網 ? 2年前

如何讓每年一度的發布會更加深入人心?在今年6月27日的SPARK2022騰訊游戲發布會上,我們就看到了不同往年的一幕: 在今年騰訊游戲發布會官方視頻號直播過程中,騰訊先鋒為用戶提供直播+云游戲的體驗方式,讓所有在線觀看發布會的玩家,都能夠在觀看直播的同時,一鍵暢快體驗游戲大作。背靠億
2022 SIGMOD 系統獎花落 Apache Spark，網易數帆燕青貢獻獲表彰

砍柴網 ? 2年前

美國計算機協會（ACM）數據管理專業委員會（SIGMOD）近日公布了2022年 ACM SIGMOD 獎結果，2022年ACM SIGMOD 系統獎授予"Apache Spark"，表彰了 Spark 社區的一眾大神，其中包括了Apache Spark 發明者 Matei Zaharia，Datab
傳音 Tecno Spark 8 手機在印度發布：指紋傳感器位置奇特

砍柴網 ? 3年前

11 月 11 日消息，中國智能手機公司傳音控股旗下 Tecno 品牌在印度推出了一款 Spark 8 手機，定位入門機型。 Tecno Spark 8 采用了雙后置攝像頭，提供了一個 1600 萬像素的主傳感器，具有 f/1.8 光圈，支持 AI 美顏、微笑拍攝、AI 人像、HDR

評論

提交建議

關鍵七步，用Apache Spark構建實時分析Dashboard

問題描述

解決方案

如何構建數據Pipeline?

階段1

關鍵七步，用Apache Spark構建實時分析Dashboard