掌握數據分析專案 5 步驟,你也可以成為數據分析專家

很多人都會問我,我都沒有數據分析相關工作經驗那怎麼辦?我要如何走向數據分析領域?有多年數據分析經驗的 Irene 認為「累積數據作品集」就是這題最好的解答,只要拿到你有興趣的公開數據就可以試著站在這些流程來做成作品集,而「定義商業問題」就成了開始數據分析最重要的環節。除了定義商業問題外,Irene 也整理出執行數據分析專案的 5 個關鍵步驟,只要你的工作內容與「透過數據驅動成果」有關,像是:數據分析專案經理、數位行銷人、數據技術人等,了解這個流程對於專案執行非常有幫助哦!

步驟一、定義商業問題 ( Define Business Use Case )

這步驟絕對是做任何題目的核心關鍵,你必須要確認你現在在做的題目是真的有需求、有商業痛點,並要能聯想,如果你完成這個這一個數據分析專案能帶來多少貢獻?

假設你在執行客戶分群分析,可以用條件式區分 ( rule based ) 或是演算法,那你要思考的問題有:

  • 什麼部門會想要用這個分析結果?會想用的原因是什麼?
  • 用了可以帶來什麼成效?是減省未來行銷預算嗎?還是更容易提升客戶的 retention rate?


假設你正在執行註冊轉換率預測,那你要思考:

  • 什麼部門會想要用這個分析結果?會想用的原因是什麼?
  • 用了可以帶來什麼成效?是提升會員訂閱數嗎?會為網站/產品多帶來多少營收?


如果你可以在專案一開始的時候就先定義好商業問題,接下來的數據分析流程一定會相對順利!

步驟二、數據準備 ( Data Preparation )

開始針對已定義好的商業問題搜集數據,在搜集數據的過程中,你需要確認數據的時間與商業範圍。在決定數據時間時,可以以專案是否講求即時性來判斷,針對不講求即時性的專案可以先搜集 1 年或更長的數據,針對講求即時性的專案則可以以最近 3 個月內的資料為準。

以客戶分群分析為例,假如你想為銀行信用卡部門解決問題,那可以搜集:

  • 歷史的客戶信用卡帳單紀錄
  • 歷史的客戶於特約商店的刷卡紀錄
  • 網站上信用卡頁面的瀏覽數據


以註冊轉換率預測為例,假如你想為電商會員經營部門解決問題,那可以搜集:

  • 歷史有註冊的會員,在註冊前的站上瀏覽數據
  • 還不是會員,但有搜集的近期站上瀏覽數據

步驟三、數據清理 ( Data Cleaning )

拿到數據以後,你必須花一些時間了解你手上的數據,這時需要用批判式思維來輔助洞察過程,這過程包含:清理、轉換、產生新的數據。在數據清理的過程中,我們會需要關注的是「數據使用的正確性」和「數據對於商業的合理性」,舉例來說:

  • 有些數據欄位是空的,那它是合理的嗎?當初是人工輸入錯了嗎?那我們需不需要排除它呢?
  • 這張會員購買紀錄好像都有按照原始國家幣別來紀錄,那直接使用合理嗎?
  • 是不是要先統一轉換成同一種幣別?
  • 這個數據現有的欄位已經適合拿來做數據分析嗎?是不是再增加什麼組合欄位會更合理?例如:地理位置如果只有經度或只有緯度,那其實沒有太大的意義。如果我們加入經度 x 緯度變成新的欄位,那就能真正表現出地理位置。

步驟四、數據分析 ( Data Analysis )

如果你是資料技術人員,你可能會想用各種資料科學演算法執行數據分析;如果你是行銷人員,你可能會想用一些商業視覺化工具輔助,幫你透過不同的維度執行數據分析。以客戶分群的例子來說:如果我們要使用演算法,可能就會用到 SkLearn、pyspark、tensorflow 、Bigquery ML 等工具來完成群集分析。

如果我們使用商業視覺化工具(Data Studio / Tableau / PowerBI 等),那我們可以按照我們想要的商業切角做成各種儀表板,例如:第一頁看整體會員績效指標總覽、第二頁看到不同產品的會員經營狀況、第三頁以分隔算法來延伸,像是一週內來站上 N 次以上,我們就把這會員分到活躍度高的會員的群組。我們也有可能結合演算法的結果再加上商業視角做成報表,這種通常是資料科學家的角色,或是一個數據專案團隊中不同職能的人一起合作完成。

步驟五、結果呈現 ( Data Visualization )

最後,切記做完的所有努力都要好好的整理「商業價值」在哪裡,專案發現必須要能回扣到第一個步驟——定義商業問題。通常做一個簡報把上面的所有過程都帶過一次,最後強調商業效益,並分享給 Stakeholder 就是一個完整的專案分析流程了!至於簡報的脈絡我喜歡這樣做:

Why:先強調為何要聽我們的數據作品?

  • 商業痛點:簡述題目背景、需求在哪裡
  • 預期成效:通常我會用情境的方式舉例

How:強調我們的做法,剛剛學的就很重要啦!

  • 把剛剛提到的步驟一至步驟五都展示過一遍,讓對方知道我們是很有邏輯地完成題目。

What:強調成品與效果

  • 成果與成效:通常會先拿歷史數據來驗證方法可行,可以展示視覺化報表與模型的系統成效數字


熟悉數據分析流程一定對你職涯有幫助,未來一定也有助於工作更順暢或累積更多的數據作品集喔!

 

Similar Posts

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *