干了這碗數據可視化的雞湯,廣告營銷就不用愁了?
作者: Paul Shapiro
我們市場營銷人員經常與大量數據打交道,但我們如何以一種簡單易理解的方式來展示這些數據呢?讓我們打開天窗,探究數據可視化專欄作家保羅·夏皮羅的說法.
最近,我一直在思考數據可視化如何能被我們營銷人員很好使用。
做為營銷人員,我們經常要花大量的時間在電子表格上,并分析這些數據。數據的最終形式通常是漂亮的圖表,圖形和可視化——然而大多數的營銷人員還不清楚數據可視化理論的原則。
讓我們一起來探索這其中的原則,然后一起制作更好的圖表吧!
為什么使用數據可視化呢?
我們的大腦有時候會很奇怪,當數據作為圖表呈現時,我們更愿意通過自己的精神去處理數據然后獲得見解,而不是通過EXCEL的電子表格去得出數據。正如數據可視化專家Alberto Cairo在他的書中“The Functional Art”說道:對于任何圖表和可視化,其首要和最主要的目標是要其成為一個工具,從而讓你的眼睛和頭腦能夠感知超越器官之外的事物。
例子1
為了闡釋這個原則,讓我們看一個真實的例子:一個名叫安斯庫伯的四重奏數據集。這個數據包括四組數據,分別由羅馬數字標記著,其中每一組數據都包含了x,y坐標。在Excel中,這些數據很難被分析:
如果我們通過常見的統計方法來分析這些數據,我們不難發現這些結論都非常相似。
在這樣的情況下,目前仍然沒有任何顯著的模型或者結構,可以輕易地從這個數據中得到。但是如果我們用散點圖來表示這些數據,一個全新的視野從此被打開了。
哇!當數據以圖形呈現時,我們看到了這個數據很多不同的地方:
數據一,展示了一個簡單的直線線性回歸關系圖。
數據二,展示了一個xy的非線性關系,其圖形是向下的拋物線。
數據三,展示了另一個直線回歸關系圖,但是帶有一個明顯的離群值。
數據四,并沒有展示出X和Y的關系,從這圖中很明顯我們可以看到X是一個常量8,
例子2
讓我們瀏覽一下與營銷有關的例子,如果我們用年齡和性別來區分瀏覽者,我們是不是很容易利用表格數據發現其中的趨勢呢?
很明顯,至少在我們可視化數據之前,我們不能立刻得到什么結論。因為這里一次有太多的變量要處理。
使用數據可視化后,一切都變得清晰了。從數據可知,總體來講,很少同一個年齡組的男性會同時訪問我們的主網站和子網站,但是有一個例外。不知為何,我們的子網站更受25-29歲的男性歡迎。
現在我們知道為什么數據可視化在數據分析里面這么重要了。接著,讓我們一起探索一下能讓我們更高效的描述數據的原則吧。
選擇正確圖表的科學。
讓我們快速討論一下視覺感知是如何工作的。這里有一個簡單的版本可以讓我們得知當我們看東西的時候發生了什么
- 我們之所以能看到東西是因為光從物體反射到人的眼睛
- 它通過感光細胞進入大腦里的視網膜,并被編碼成電信號
- 現在,你的大腦可以察覺到的基本特征,也被稱作前注意階段屬性
- 大腦會根據你的記憶(標志性記憶,工作記憶和長期記憶)進行更多的分析和分解信息
前注意階段屬性
讓我們更詳細的說明一下步驟3。前注意階段屬性是一種特定的視覺屬性,這個屬性可以立刻(不超過200-250毫秒)檢測,并且對大腦來說毫不費力或者不需要額外的處理。
前注意階段屬性包括: 顏色,長度,寬度,方向,形狀,大小,圍欄,色調,密度,位置
雖然能夠很快檢測到前注意階段屬性,但有一些特征是能夠更快被檢測的。例如,相對于陰影或形狀我們可以很快的知道顏色的變化,
讓我們來驗證一下這個理論,如果給你一個由不同數字(例如,不同形狀)組成的文本塊,你可以快速找出5嗎?你不可能做到的。
現在,如果我們現在現在加深5的陰影,我們就可以更快的發現它們。
如果我們用完全不同的顏色表示,我們會更快的發現它們。
這是一個非常有說服力的信息。你可以將這些特征融入你的圖表和可視化,基本上不需要任何心理過程,就可以幫你改善數據通信。
Cleveland & McGil的研究:為什么選擇對的圖表很重要
統計學家William S. Cleveland和 Robert McGill把前注意階段屬性和其他關于圖形知覺研究的概念進行了一些開創性的關于數據可視化的科學研究
Cleveland and McGill開發了一個元素感知任務的層次結構,排列人們如何使用它們來解釋數據。從最準確的感知到最不準的感知順序,任務如下:
1.順著共同刻度的定位
2.順著非對齊、同一刻度的定位
3.長度,方向,角度
4.面積
5.體積,曲率
6.陰影,顏色的飽和度
讓我們探討一下這種層次結構如何能幫我們為數據集選擇一個更好的可視化效果。
下面這個例子比較了不同產業在2010到2015年間所得到的風險投資資金
同心圓形圖
我們通過圓的大小不同來表示不同產業的風險投資資金
現在,讓我們用幾個問題來了解這個圖,當然我后面也會給你們答案,但是現在,讓我們先試著回答他們吧:
- 在2015年哪一個產業收到最多的風險投資資金呢?
- 在2015年哪一個產業收到第二多的風險投資資金呢?
- 猜測一下,相對于2015年,生物科技在2012年的資金占了多少百分比呢?
- 猜測一下,相對于2015年,娛樂媒體在2012年的資金占了多少百分比呢?
把你的答案記下來,然后繼續往下看,并自問同樣的問題。這是同一個數據,只是表現的不同,這個時候你的答案有發生變化嗎?
條形圖1
這是同樣的風險投資數據,只是有一點表現的不同。
條形圖2
我猜你的答案已經變了-至少你想更改答案。你對這個數據更有信心。這個圖表的每一次更迭都是利用了Cleveland和 McGill的層次結構里的信息,利用這些可以讓你更容易理解數據。
這是最后一個圖表,條形圖2,這個條形圖包括了真實數據
問題 :哪一個產業在2015年收到最多的風險投資資金?
答案: 生物科技。
這個最簡單的問題,因為當以同心圓圖表示時你也知道這個答案。然而,圓形圖比條形圖更難理解,因為圓型圖實際上是用了”區域”而條形圖用了”長度”。我們在捕捉圓的區域信息時會比較困難,所以圖表的形狀阻礙了我們的感知任務。
在條形圖1,我們也用了”長度”,但是條形圖2更容易理解。因為使用了“順著共同刻度的定位”能讓你清清楚楚看清楚生物科技所收到的風險投資資金是最多的。
?
問題: 哪一個產業在2015年收到第二多的風險投資資金呢?
回答: 消費產品會服務產業。這個在同心圓圖里面是非常難看出來的。消費產品和服務的風險投資金的數量是48億美元,這數字非常接近娛樂媒體的數值47億4900萬美元。如果我們想要區域來比較相似的值是很困難的。
條形圖1也不是這個數據的最佳編碼。在圖表2中,它使用的“順著非對齊、同一刻度的定位”(在Cleveland and McGill的層次結構中處于第二佳感知效果)表現出作為編碼的小倍數不如在“順著共同刻度的定位”(在Cleveland and McGill的層次結構里的最佳感知效果)中被感知的效果好。
?
猜測一下,相對于2015年,生物科技在2012年的資金占了多少百分比?
54%。在2010中,生物科技收到了398400萬美元,而在2015年,它收到了740800萬美元。
在同心圓圖里面想要知道這些信息幾乎是不可能的,因為它是使用“區域”大部分人都會錯誤的說成80%。
?
猜測一下,相對于2015年,娛樂媒體在2012年的資金占了多少百分比?
35%。在2010年,娛樂媒體產業收到了162400萬美元的風險投資基金,在2015年,它收到了474900萬美元的風險投資資金。
和之前那個例子一樣,想要在同心圓里正確的知道這些比例是非常困難。人類不擅長捕捉一個區域里的不同點,特別是圓形的差異。大多數人都會錯誤的說有50%。
結論
數據可視化是藝術和科學的一部分。雖然沒有所謂正確的方法來可視化一部分數據,但是,我們可以用一些概念來幫助我們用更高效的圖表來可視化數據。我已經提出了這些部分原則并解釋了前注意階段屬性以及如何利用Cleveland & McGil的感知層次。
下一次,如果你要在一個EXCEL中創建一個圖表,制作一個報告或演示文稿,想想這些概念,它們讓你的數據視覺效果大為改善。
End.