首頁 > 科技

你會不會正在做無意義的資料分析?

2021-08-18 03:05:49

你會不會正在做無意義的資料分析?

並沒有符合你的預期,活躍度?

假設活躍度的口徑,是使用者當天用過登入app的記錄

問題1、登入app的使用者真的就算是活躍了嗎?

問題2、後臺記錄的登入條件上是否有限制?push頁進來的也算登入嗎,還是一定要首頁進來的?

問題3、統計量下的活躍使用者真的是有價值的客戶,可以為後續的轉化提供基礎,沒有噪聲使用者的嗎?

一、關於預警指標初認識

1、常用的使用者資料指標有哪些?

理解「日活/月活度資料指標」-使用場景

到底活躍對我們意味著什麼?

活躍使用者,是相對於「流失使用者」的一個概念,是指那些會時不時地光顧下app,併為app業務帶來一些價值的使用者。

活躍使用者是一個公司講故事的資本。針對的是小型的,有融資需求的公司,如果一個公司有百萬以上的日活使用者,即使沒有盈利,依然會受到投資人的青睞,變現是小事,有沒有使用者使用才是大事。現在產品的變現方式已經很成熟,有百萬使用者的產品通過接入廣告,也可以獲得一些收益。

在使用者活躍分析的時候,不是為了逼使用者天天來戳一下,而是為付費、或者其他轉化提供穩定的支援,那麼選擇活躍度指標時需要考量公司的業務目標。

理解「日活/月活度資料指標」-日和月的定義

日:一般我們指一個自然日,即0:00–24:00

月:上個月的1號0點-當月最後一天的23點59分

月活躍使用者的計算邏輯是什麼?

A、每一天的活躍使用者的累加(或者取平均值)

B、這個月所有活躍使用者去重的總數

理解「日活/月活度資料指標」--活躍的定義

活躍度的幾種口徑

A、檢測到使用者的登入資訊(一些強登入的app,例如網銀、網遊)

B、指定多個頁面的埋點資料上報

C、通過後臺帶使用者資訊或者使用者ip的請求資訊(無賬號APP)

D、停留指定頁面超過一定時長

理解「使用者日活/月活度資料指標」--活躍的定義

理解「增量資料指標」--新增使用者的使用場景

對「新增使用者」的定義實際上是通過使用者新增的後續行為進行一個簡單的使用者分層,滿足當前運營階段的「關鍵指標」的使用者作為有效新增使用者,也是後續運營的重點使用者。

在定義好「新增使用者」的指標後,拉新行為也就並不是只看重下載和開啟,而是圍繞核心指標進行優化,例如以註冊為指標,需要通過觀察使用者的註冊行為路徑優化註冊流程體驗。

理解「增量資料指標」--新增使用者的定義

在目前的「新增使用者」的定義中,總的來說,可以分為兩種方式:

一種方式為一段時間內開啟應用的新使用者數量,這是廣義的新增使用者。

另一種方式為一段時間內產生過「關鍵行為」的新使用者數量,比如:註冊賬號,啟用賬戶,而對於增長黑客而言,則更關注第二種「新增使用者」。

理解「留存率」--留存率的使用場景

使用者留存率是驗證產品使用者吸引力很重要的指標。通常可以利用使用者留存率與競品進行對比,衡量應用對使用者的吸引力。對於某一個相對成熟版本的應用,如果使用者留存率有明顯變化,則說明使用者質量有明顯變化,很可能是因為推廣渠道質量的變化所引起的。

理解「增量資料指標」--新增使用者的使用場景

對「新增使用者」的定義實際上是通過使用者新增的後續行為進行一個簡單的使用者分層,滿足當前運營階段的「關鍵指標」的使用者作為有效新增使用者,也是後續運營的重點使用者。

在定義好「新增使用者」的指標後,拉新行為也就並不是只看重下載和開啟,而是圍繞核心指標進行優化,例如以註冊為指標,需要通過觀察使用者的註冊行為路徑優化註冊流程體驗。

理解「增量資料指標」--新增使用者的定義

在目前的「新增使用者」的定義中,總的來說,可以分為兩種方式:

一種方式為一段時間內開啟應用的新使用者數量,這是廣義的新增使用者。

另一種方式為一段時間內產生過「關鍵行為」的新使用者數量,比如:註冊賬號,啟用賬戶,而對於增長黑客而言,則更關注第二種「新增使用者」。

理解「留存率」--留存率的使用場景

使用者留存率是驗證產品使用者吸引力很重要的指標。通常可以利用使用者留存率與競品進行對比,衡量應用對使用者的吸引力。對於某一個相對成熟版本的應用,如果使用者留存率有明顯變化,則說明使用者質量有明顯變化,很可能是因為推廣渠道質量的變化所引起的。

理解「留存率」--留存率的含義

留存指的是:一批新增使用者中,在指定的時間段內,沒有解除安裝的使用者(app場景)。

新增賬號第X日:某日新增的賬號中,在新增日後第X日有登入行為記為留存

新增賬號X日內:某日新增的賬號中,在新增日後的X日內有登入行為記為留存

活躍賬號第X日:某日活躍的賬號中,在新增日後第X日有登入行為記為留存

活躍賬號X日內:某日活躍的賬號中,在新增日後的X日內有登入行為記為留存

其他的基礎指標的定義

2、哪些指標需要做指標預警

A.指標跟業務掛鉤。可以做指標的變數很多,但是可以拿來做預警的卻不多,選擇直接跟指標掛鉤的。例如電商,直接就是銷售量,介面就是呼叫次數,產品就是環節轉化,運營就是使用者增長量

B.避免預警指標過剩,造成指標預警不重視,你設定報警的指標,一定是要真的很嚴重,你才能推送的那種,不要設定不嚴重的,但是造成郵件氾濫,沒人理會預警就得不償失了。

C.預警指標需要做重要性排序,先實現會經常出現異常導致你經常加班分析的指標,先實現在業務層面的重要指標,預警指標推送時間不要擠在一起,不然你同時接受多個預警,你不會仔細去看,而且要是都是異常的話,一下子那麼多異常出來,你會心慌,那麼分析思路就不那麼清晰了。

3、指標預警的大類

介面類的資料指標預警(主要用於it部門監控介面或者平臺功能穩定),模型準確率

產品類指標的資料指標預警(主要是產品部門用於監控產品功能的轉化,產品的訪問之類的)

運營類指標的資料預警(主要是運營部門用於監控使用者的資訊,例如使用者的激增,或者使用者的大幅度訪問下降。)

二、指標構建方法

1、比率佔比法

其實就是看各個區間的佔比是否跟之前的比較接近,但是這裡需要注意的是,不要把「之前」拉的太長,一般是最近7天或者最近3天就可以了。那麼這個時段之前的佔比(或資料量),這個佔比有以下幾種方法可以參考:

A.就是計算過去幾天的每個時段的平均佔比(或資料量)。

B.過去7天,按照距離的時間越長,那麼權重變少,例如最近往前推一天是0.5,最近往前推二天是0.3,這樣子的權重計算。

C.就是隻用過去一天的資料做對比,但是這個不太實際,不過也要看你的業務是怎樣的。

2、統計方法

A.時間序列分析。資料量在時間序列上是可以有規律可以遵循的,所以可以利用時間序列分析的方法,預測當天的資料量,若實際與預測的資料量作差值,相差太多則觸發指標預警推送。(這種方法不推薦,在理論上可以過得去,但是實際的運用其實相對複雜並且效果也不一定好)

B.相關係數計算。第一點的佔比法中,需要每個時段都去計算差別,產生的指標就會多,一旦這種資料量的類型多起來,就會很複雜,所以可以將這些佔比列成一個向量,計算今天與之前的資料量組成的向量的相關係數的大小,當太小的時候,主動觸發預警。

3、差值&定值法

這個方法是最簡單的,這個在模型監控中常用到,其實就是將原先的模型效果與現在的模型效果做比較,或者直接計算模型KS後者auc值看是否低於某值,則預警,但是這裡注意的是,這種模型的預警一般沒辦法以天為週期計算,因為模型的y值往往是有滯後性的。

4、孤立點檢測

對比以上幾個在單一維度上的方法,孤立點檢測是基於多維度建立的向量來觀察異常資料點的方法。

三、指標預警的方式

指標預警的方式-釘釘機器人&企業微信機器人通知

釘釘機器人還有企業微信機器人都設定了群機器人的功能,大部分的開發會拿來檢測任務是否正常運行,或者定時任務是否完成運行的提醒,所以你也可以拿來作為你的指標預警推送,網上都有響應的教程可以作為參考,寫python即可實現。

釘釘機器人詳細介紹連結:

https://developers.dingtalk.com/document/app/custom-robot-access

企業微信機器人:

https://work.weixin.qq.com/api/doc/90000/90136/91770

指標預警的方式-郵件通知

當公司沒有第一點的軟體,或者機器不能連結外網的時候,可以藉助郵件推送的方式,利用python中的smtplib包實現。

指標預警的方式-平臺推送

到了特地為每個分析師都開發了這個預警平臺或者自研的bi平臺可以滿足預警推送的功能化,也可以通過平臺推送,這個話可能涉及的東西相對多一些,如果你會寫介面,藉助django框架寫介面之後吐給前端去幫你展示也是可以的。

五、指標預警平臺


IT145.com E-mail:sddin#qq.com