第二篇:Power BI數據可視化之基于Web數據的報表制作(經典級示例)
作者:穆晨
- 前言
- Power BI的三大工作區
- 導入數據
- 數據塑形 – 工作區介紹
- 數據塑形 – 工作流程
- 報表制作 – 工作區介紹
- 報表制作 – 詳細流程
- 小結
- 課后作業
前言
報表制作流程的第一步顯然是從各個數據源導入數據,Power BI能從很多種數據源導入數據:如Excel,CSV,XML,以及各類數據庫(SQL Server,Oracle,My SQL等),兩大主流開源平臺(Hadoop,Spark)等等。本文篇幅所限,無法一一說明,僅就網頁獲取數據的方式進行講解(其他方式大同小異)。
然后本文將在Power BI后臺工作區(下簡稱后臺區)對獲取到的數據集進行塑形。所謂塑形就是確定數據集的列名以及數據類型,還有進行一些基本數據清洗轉換工作,以保證Power BI報表模塊能正確解讀數據集。塑形后的數據集其實就是Power BI報表繪制區(下簡稱報表區)的輸入。
一旦數據塑形好,我們就能切換到Power BI報表區繪制各種報表了。最后本文將制作一張報表,愉快地結束本次學習。
Power BI的三大工作區
在上篇中,大致介紹了Power BI的開發流程,如下圖所示:

剛打開Power BI,將進入到報表區。下圖標記了報表區中后臺區的入口:

下圖標記了后臺區進入報表繪制區的入口,點擊該按鈕會返回到報表區并使用塑形后的數據更新報表:

導入數據
本文采用的數據集來源于如下網頁: http://www.bankrate.com/finance/retirement/best-places-retire-how-state-ranks.aspx
該網頁描述的主題是”退休以后生活在哪里(美國哪個州)最合適”,表中字段信息均為各州在居住成本、稅率、犯罪率等方面在全國的排名。
用瀏覽器打開看看:

首先,在報表區點擊獲取數據:




數據塑形 – 工作區介紹
進入后臺區后,將看到如下視窗:


另外需要注意的是查詢設置窗口。我們在工作區做的任何操作在這里都會記錄下來,可隨時點選以回退到過去的操作(不要Ctrl + Z哈):

關于查詢設置窗口還有很多好玩的用法,本文篇幅所限就不一一說明了,讀者可自行嘗試。
數據塑形 – 工作流程
下面我們回過頭來看看獲取到的這份表格:

然后檢查各列的數據類型,確保需要統計的字段是可統計的類型(如整數,浮點數等)。具體方法是將功能欄切換到”轉換功能欄”,每當我們點選一列時,下圖紅色標記位置將顯示列的數據類型:

解決方法很簡單,在”轉換功能欄”配置替換機制將這些異常數據修復。比如將”27(tied)”替換為”27″就可以了。
數據修復完畢后,即可對它進行轉型。只需右鍵->轉換類型-> 整型即可,也可以直接在功能區進行修改:

當然不是的,假如數據量很大,幾千行,那不得加班加點搞了。幾萬行,幾十萬行呢?在使用任何工具的時候都應該思考如何”偷懶”,這里可使用Power BI的數據合并功能輕松做好這個需求。
在維基百科里,可以搜索到美國各州對應的簡稱(https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations),打開該網頁:

1. 移除頭兩行表頭信息:


3. 篩選掉行政特區:

5. 將第一行選定為表頭:


接下來是見證奇跡的一刻^_^:將兩份表格Join起來。具體方法是在”開始功能欄”點選”合并查詢”,然后設置連接信息:



至此,一個階段的數據塑形算是完成了,接下來就可以進入到報表區繪制報表。下面是本階段數據塑形的結果表:

需要提醒讀者的是數據塑形得越規整,接下來的報表制作就越是得心應手。所以請讀者耐心看完這部分的講解,心急吃不了熱豆腐:)
報表制作 – 工作區介紹
回到報表繪制區,我們將看到如下視窗:

報表區的右側則是我們的工作區:

報表制作 – 詳細流程
Power BI中,不論是繪制什么圖表,總體的步驟都是以下幾步。下面筆者以一個簡單報表為例講解Power BI中報表制作的總體過程。
1. 選中目標繪制圖形。我們這里選擇一個經典的條狀圖吧:



3. 篩掉一部分數據。如果我們想只分析美國事宜退休人員居住排行榜前10的州,可設置篩選器:


4. 調整可視化元素呈現順序。關鍵是在建模功能區設置列的排序方式。我們首先選中需要調整順序的目標列:




6. 排版布局。在報表區的格式功能區有不少排版功能選擇:

7. 保存發布。Power BI保存的本地工程文件為.pbix格式。除此之外用戶還可以將報表發布出去,在移動端(如平板)隨時展示已制作的報表。發布及發布后的使用方法會在下一章講解,敬請期待。
小結
總的來說,使用Power BI繪制報表最關鍵的還是在于數據塑形步驟。只有這個步驟做好了,報表繪制起來才能得心應手。
在充分掌握了數據塑形技巧后,就可以將更多精力放在各種各樣的可視化圖形上。要注意的是Power BI除了包含不少內置圖表,還支持從微軟官網或其他地方下載成百上千種圖表格式。
課后作業
由于在之前我們已經對數據做了初步塑形了,因此之后的報表制作將非常輕松愉快。接下來讀者可盡情發揮自己的想象力制作各種酷炫報表,盡量搞清楚Power BI中所有內置圖形的繪制方法。
下面是筆者自己隨便做的一份報表,輕拍^_^
?
End.
?