大數據:5種方法解讀網站分析數據
數據是進行網站分析的基礎,Google Analytics為一個網站提供了上百個報告和數據指標,它們分散在不同的維度中,如何來解讀這些數據呢?單一的數據本身沒有任何意義,只代表了它記錄到的信息。(比如PV只代表頁面被顯示的次數)不同的處理方法也會獲得不同的數據結果。(追蹤代碼在頁面的位置會影響PV數據的記錄結果)網站分析的工作就是通過對網站數據的解讀,產生有意義的結果。(將數字轉化為人類的語言)
跳出率是我們在網站分析中比較關注的一個數據指標,單一的跳出率數據有什么意義嗎?
舉個例子,網站的跳出率是50%,一個不好也不壞的數字。這個數據有什么意義嗎?我覺得沒有。因為它不能告訴我們任何信息。單純的數據無法被解讀。數據只是數據,不是人類的語言!
面對這樣的數據,在進行網站分析時可以用5種方法來對數據進行解讀。讓數據變的更易讀更有意義。并對下一步工作具有指導意義。下面用5種方法逐一來解讀“網站的跳出率是50%”這個數據。
1 了解數據的意義和產生的原因
解讀數據前先要清楚的了解數據背后所代表的意義及產生的原因(這個數據是如何被計算出來的。)
解讀數據: 網站的跳出率是50%
跳出: 指單頁訪問或訪問者的次數,即在一次訪問中訪問者進入網站后只訪問了一個頁面就離開的數量。
跳出率: 指某一范圍內單頁訪問次數或訪問者與總訪問次數的百分比。
跳出率=跳出訪次/所有訪次
結論: 跳出率是一個負面指標,數據高不是個好事情。這個網站的跳出率有50%,說明有一半的訪次在網站上只瀏覽了一個頁面就離開網站了。

2 和歷史數據做對比
前面知道了跳出率是個負面指標,但單一的50%我們不知道他對于網站來說究竟是算高還是算低,因為沒有參照物。我們需要一個參照指標來對目前的數據進行衡量。這個參照指標可以是網站歷史同期的指標。(對于有銷售季節性的網站,歷史同期數據很重要)也可以是行業基準指標。
對比前首先要確定這個數據產生的時間,然后選擇有比較意義的歷史數據,通過對比可以看出目前數據的好壞。
解讀數據: 網站的跳出率是50%
確定數據產生的時間范圍是2010年3月份。選擇歷史同期數據2009年3月份數據進行對比。(或者行業基準數據)
歷書數據: 2009年3月份的跳出率是40%
行業數據:跳出率45%
結論:3 月份網站的跳出率是50%,這個數據高于去年同期數據,同時也高于行業基準數據。根據跳出率的定義,3月份網站對訪客的表現變差了,有更多的訪客只在網站瀏覽了一個頁面就離開了網站。

3 把數據帶入到趨勢中
除了和歷書數據相比,還要把數據帶入到趨勢中,因為數據不是孤立的,產生的原因多種多樣。通過趨勢中的背景信息可以獲得更多的信息來解讀數據。
解讀數據: 網站的跳出率是50%
將3月份網站的跳出率是50%的數據帶入到網站第一個季度的趨勢中:1月份跳出率40%,2月份跳出率60%,3月份跳出率50%。通過對比發現在第一季度中網站的跳出率是一個先增后降的變化趨勢。3月份的跳出率雖然比歷書數據和行業數據要差,但其實是一個向正常的回歸。而真正造成3月份跳出率高的原因其實發生在2月份。這時候就需要對2月的情況進行檢查,比如:網站在2月份進行過改版,或者開展了某種營銷活動。導致數據不穩定。
結論: 50%是在變化趨勢中的一個數據,雖然比歷史同期的表現要差,但是是向正常趨勢的回歸。所以不能僅憑50%的跳出率就說網站在3月份的表現變差了。

4 這是一個匯總數據嗎?
通常網站的數據是對網站內不同頻道,不同頁面在不同時間內表現的一個匯總情況。在網站中,由于內容和功能的差異,所以各個頻道或頁面的數據表現都會不同。將網站總體數據分解到不同的內容中可以找到真正存在問題的部分。
解讀數據: 網站的跳出率是50%
網站3月的跳出率是50%,是由3月每一天的跳出率匯總的。也可以是由網站的每個頁面,每個頻道數據匯總的。將數據細分到每個頻道中會發現可能大部分頻道的跳出率都低于50%,只有某個頻道80%的跳出率拉高了整個網站的跳出率水平。
結論: 網站的整體數據是沒有可操作性的,因為我們不知道問題真正出在哪里。通過細分可以找到真正出問題的地方,并且有針對性的進行優化,進而提高整個網站的表現。

5 這是一個平均數據嗎?
網站的百分比數據通常都是一個平均數,比如跳出率,平均停留時間,平均頁面瀏覽量等等。和匯總數據一樣,這種數據沒有可操作性,并且掩蓋了網站中表現不好的部分。打破這些平均數可以發現真正有問題的部分。
解讀數據: 網站的跳出率是50%
50%網站跳出率=網站中所有跳出訪次/網站所獲得的所有訪次
可以按多種維度來打破網站的平均值
按流量來源:
百度跳出率=來自百度的跳出訪次/百度帶來的所有訪次
按訪客地區:
北京跳出率=來自北京的跳出訪次/北京帶來的所以訪次
按訪問時間:
第一周跳出率=第一周的跳出訪次/第一周的所有訪次
按頻道內容: (需要有規范的URL規則支持)
新產品頁跳出率=所有新產品頁面跳出訪次/網站獲得的所有訪次
按頁面屬性:
營銷推廣跳出率=推廣頁面的跳出訪次/推廣頁面獲得的所有訪次
按訪客屬性:
新訪客跳出率=新訪客的跳出訪次/新訪客的所有訪次
結論: 不同來源,不同地區,不同頁面和不同的訪次有不同的跳出率。通過細分可以打破網站的平均數陷阱。

最終結論:跳出率是一個負面的指標。網站50%的跳出率是在一個變化趨勢中的數據,雖然高于歷史和行業水平,但是在向正常水平的回歸。通過對跳出率的細分可以發現,高跳出率是由于某個地區或某個流量來源的新訪客在營銷推廣類頁面上的表現造成的,這部分數據拉高了整站的跳出率水平,這類營銷推廣活動和新訪客是造成網站在跳出率上表現差的原因。
解決的方法是
1優化營銷活動頁面。增加頁面上的引導信息,降低跳出訪次。
2分割流量進行對比。網站分割出營銷推廣的數據后,與歷史數據再進行對比。
3細分現有流量。分割數據后對有問題的部分進行細分,對高跳出率的流量重點優化。
via:數據分析
End.