九大數(shù)據(jù)相關(guān)分析方法

| 2022-09-28 admin

一、什么叫“相關(guān)”

簡(jiǎn)單來(lái)說(shuō),相關(guān)就是兩個(gè)事件之間有關(guān)系。比如:

  • 廣告投入與銷售業(yè)績(jī)
  • 下雨刮風(fēng)和門店人流
  • 用戶點(diǎn)擊和消費(fèi)行為

即使沒(méi)有做分析,直觀上看這些事件之間也有關(guān)系。但是不做分析的話,具體是啥樣的關(guān)系,很難說(shuō)清楚。而相關(guān)分析,就是找出這種關(guān)系的辦法。

二、什么是“相關(guān)分析”

相關(guān)分析,特指:找到兩個(gè)數(shù)據(jù)指標(biāo)之間的相關(guān)關(guān)系。

比如一個(gè)APP里,用戶反復(fù)瀏覽一款商品,所以他會(huì)買嗎?

  • 一派認(rèn)為:看的多,說(shuō)明用戶感興趣,所以會(huì)買
  • 另一派認(rèn)為:看了這么久都不買,那肯定不會(huì)買了
  • 還有一派認(rèn)為:看多少次跟買不買沒(méi)關(guān)系,得看有沒(méi)有活動(dòng)

聽(tīng)聽(tīng)似乎都有理,最后還是得數(shù)據(jù)說(shuō)話。這里討論的,就是:用戶瀏覽行為與消費(fèi)行為之間,是否有關(guān)系的問(wèn)題。相關(guān)分析,即要找出這兩個(gè)指標(biāo)之間的關(guān)系。

三、直接相關(guān)關(guān)系

注意:指標(biāo)之間可能天生存在相關(guān)關(guān)系。

常見(jiàn)的有三種形態(tài):

  • 在結(jié)構(gòu)分析法中,整體指標(biāo)與部分指標(biāo)之間關(guān)系
  • 在指標(biāo)拆解法中,主指標(biāo)與子指標(biāo)之間的關(guān)系
  • 在漏斗分析法中,前后步驟指標(biāo)之間的關(guān)系

直接相關(guān)的情況下,兩個(gè)指標(biāo)出現(xiàn)同時(shí)上漲/下跌的趨勢(shì),是很好理解的。比如:

  • 整個(gè)公司業(yè)績(jī)都不好,所以A分公司業(yè)績(jī)也很差(結(jié)構(gòu)分析)
  • 客戶數(shù)太少了,所以整體業(yè)績(jī)不好(主指標(biāo)、子指標(biāo))
  • 看到廣告人數(shù)太少了,所以最后轉(zhuǎn)化不好(前后步驟)

如果直接相關(guān)的兩個(gè)指標(biāo)沒(méi)有同漲同跌,往往意味著問(wèn)題。比如做用戶增長(zhǎng),注冊(cè)的新用戶數(shù)量大漲,但付費(fèi)轉(zhuǎn)化率持續(xù)大幅度下跌,這就說(shuō)明獲客效率在下降,可能是目標(biāo)用戶已耗盡,也有可能是渠道在造假,也有可能是獲客方法有誤,總之要深入分析

四、間接相關(guān)關(guān)系

有些指標(biāo)并非直接相關(guān),但理論上是有關(guān)系的。比如品牌廣告與銷售收入,理論上肯定是存在關(guān)系:廣告多了,知名度高了,銷量肯定好。但是品牌廣告又沒(méi)有帶貨鏈接,不能直接說(shuō):有5000萬(wàn)的銷售業(yè)績(jī)是用戶通過(guò)廣告鏈接購(gòu)買的。此時(shí)就是典型的間接相關(guān)關(guān)系(如下圖)。

分析間接相關(guān)關(guān)系,有2種常用方法,一種是散點(diǎn)圖法,可以直接做散點(diǎn)圖,發(fā)現(xiàn)相關(guān)關(guān)系

計(jì)算出可以發(fā)現(xiàn),廣告投入與銷售兩個(gè)指標(biāo)之間,確有相關(guān)關(guān)系。至于具體是怎么相關(guān)的,可以再做進(jìn)一步研究。

間接相關(guān)關(guān)系,經(jīng)常用來(lái)找改進(jìn)業(yè)績(jī)的措施。比如互聯(lián)網(wǎng)行業(yè)里著名的“魔法數(shù)字”法,本質(zhì)就是找用戶瀏覽、點(diǎn)贊、分享、登錄等行為,與用戶留存、付費(fèi)行為之間的相關(guān)關(guān)系。如果發(fā)現(xiàn):當(dāng)用戶點(diǎn)贊4次以后,用戶的90天留存會(huì)明顯增高。那么就把這個(gè)“4次留存”稱為魔法數(shù)字,然后努力推動(dòng)用戶完成4次點(diǎn)贊。

五、相關(guān)分析的不足之處

世界上沒(méi)有完美的分析方法,相關(guān)分析有兩大不足之處。

不足一:相關(guān)不等于因果。

兩個(gè)指標(biāo)相關(guān)關(guān)系,本質(zhì)上只是一條數(shù)據(jù)公式計(jì)算出來(lái)的結(jié)果,至于兩個(gè)指標(biāo)為啥相關(guān)?不能直接從計(jì)算里得結(jié)論。實(shí)際上只要兩個(gè)指標(biāo)走勢(shì)相似,在計(jì)算的時(shí)候就能顯示出相關(guān)關(guān)系。

這里有一個(gè)經(jīng)典例子,下圖是我在小區(qū)里種的一棵樹(shù)的高度,與我國(guó)GDP之間的相關(guān)分析。大家會(huì)發(fā)現(xiàn):哇塞!這倆指標(biāo)完美相關(guān)哦!那么我種的這顆樹(shù)就是我國(guó)的龍脈,能保佑我國(guó)經(jīng)濟(jì)騰飛咯?——當(dāng)然不是!這就是相關(guān)不等于因果的直接體現(xiàn)。

不足二:相關(guān)分析不能解決非量化指標(biāo)問(wèn)題。

很多時(shí)候,我們想找的關(guān)系不能用數(shù)據(jù)量化。比如我們想知道:旗艦店是不是比社區(qū)店更能吸引消費(fèi)者。一個(gè)店是不是旗艦,取決于位置、裝修、宣傳等諸多因素,不能粗暴的用開(kāi)店面積、員工人數(shù)等指標(biāo)來(lái)代替。

想分析這種非量化特征與指標(biāo)之間的關(guān)系,需要用到另一種分析方法:標(biāo)簽分析法。