最近讀到一篇文章說到:分析工程師的崛起 (THE RISE OF THE ANALYTICS ENGINEER)。整篇文章看完或許也不容易抓到重點。但是,我認為先不論這篇文章的論點,先思考一下數據分析到底是什麼?也就是說,如果你連數據分析都沒有搞清楚其中的定義,你要如何產生價值?
「數據分析」這個術語,據說是在1962年,由美國數學家 John Tukey 首次使用,當時他提出來這個定義,不同於以往的統計定義 -「數據分析」是專注於從數據中提取有價值的資訊的過程,而不僅僅是數學公式。所以,關鍵就是:數據分析包括從數據中提取價值的過程、技術、工具和計劃等活動。它不僅著重於對數學公式的理解和發展,而且還注重從數據中提取價值資訊,所需要的結構化的一種過程。
根據上面的說法,我們用白話文來說,數據分析應該有這一些活動:業務目標的設定、數據的獲取、數據的清理與準備、數據的建模與分析,最後是一種數據的呈現。所以,負責數據分析的分析師是不是應該就是:從數據中獲取、處理和匯總資訊,以發現業務價值,為其自身的責任呢?
思考一下,數據分析確實是一個過程,或許說它是一種流程。這個過程與流程,我想問的是:你該如何在這裡面進行自我的價值實現呢?很多軟體廠商鼓勵你學習他們家的軟體,不是不好,一旦學會之後,你在流程裡,你能貢獻什麼呢?程式語言也是一樣,你很會寫程式,你在分析這個流程中,你能貢獻出甚麼嗎?
軟體專家、程式設計師與數據分析師的定義,差別最大的就在這裡。數據分析師關注數據背後所產生的價值!數據分析師需要軟體專家與程式設計師的技能,但是這些技能可能僅僅貢獻在清理與準備、建模與分析,或是呈現上的視覺表象,數據的價值呢?必須要結合業務的目標來看。
有過經驗的數據分析師都知道,整個分析流程中,很痛苦的就是在數據獲取,然後數據清理與準備的這個階段。這篇文章就說到分析工程師在這一個階段給出的貢獻。以前,我們還讀到一些文章說到:MIT 設計了數據清理的機器人。無論如何,就從整體數據分析來看,每個環節都需要做到位,才有機會將數據的價值給挖掘出來。
所以就有很多人說:數據分析是很耗費金錢資源的。這句話,我十分的同意!可是,我也會反問:你不投資,如何產生效益?所有的投資效益分析都是一個分數!分母是你投入的成本,分子是你產生的效益。分母為零,全世界小朋友都知道那個分數就不存在了。所以,你不投入、不投資,永遠也不會發生效益!關鍵是你的業務目標與方向是什麼?沒有目標與方向,你亂投資就一定會無效用,相反的,有目標與方向,你可能會產生價值!這才是關鍵。也因此,你永遠要記住 John Tukey 跟你說的:要注重從數據中提取價值。這個方法的第一步就是:業務目標的設定。
技術固然重要,可是只有技術無法讓你成為專業的數據分析師,你還需要方法!你有了方法,你才有機會把企業的策略,轉化為你的數據策略,設立你的業務目標,並且規畫後續的步驟,才能符合 John Tukey 所說的定義。這個方法,你還不知道嗎?請你參考我們的 網站 或是 Facebook。最近,我們可能會有 說明會,來聽看看吧。