數據分析的能力

吳傑
Oct 3, 2024

--

陳昇瑋先生的遺著,2019年出版的《人工智慧在台灣》中,第三章:人工智慧的誤解與迷思,把現在的普遍的問題,說得很清楚!多數人在大量商業資訊的影響下,已經忽略了。有關於數據分析的,在第123頁,迷思三,請看下圖的原文。有兩個關鍵:①忽略了非結構化資料②就是產出報表,讓主管解讀。

書的影本

數據分析確實沒有那麼簡單!關鍵是,不簡單的工作,如果做到了,才是一種競爭力的提升。數據分析的目標,或說是商業價值,重點只有兩個字:「預測」。如果能做預測,很多商業活動不僅是可以節省成本,甚至創造更多收入與利潤。產出報表來解讀,最多只是完成了「描述型分析」!因為,各式各樣的報表所呈現的是「過去與現在的數據」,使用這些數據,或是報表,或是圖形,做出的分析,多半只是一種「推論」,準確度是令人質疑的。

不過,「描述型分析」(descriptive data analysis) 確實是「探索型分析」(exploratory data analysis)與「推論型分析」(inferential data analyses) 的基礎。也就是說,不斷地向上運作,才有可能做到「預測型分析」(predictive data analysis)。都知道人工智慧時代,很多時候需要利用數據建模型,模型的目的確實是推動「預測型分析」的準確!可是,你也知道只有模型是不夠的。更多的數據,包含上述的「非結構化資料」,才有機會讓模型不斷的優化與準確。就如同此次 (2024年10月) 的山陀兒颱風,我相信氣象的研究單位,一定收集了不少數據,藉此來學習這一次怪異的秋颱路徑,優化下次預測的準確性。

確實,數據分析其實也就是一次又一次的「從經驗中學習」(learn from experience) 的概念。這個概念,不是我說的,而是 Tom Mitchell 的定義,因為他們說:「機器藉由分析數據,從經驗中學習。」這其實就是你所知道的機器學習的概念。有數據、會分析、用工具,數據分析再也不簡單了,因為機器學習就是現在人工智慧的核心與基礎

所以,從上述的文字,你可以知道:你要有數據,才有機會分析,分析需要利用工具。這一系列的工作,其實一點也不令人驚訝!因為,人類自十七世紀以來,針對各種研究都已經形成一套 scientific method (科學的方法),分析也不例外。所以,我們說分析是一套流程,或說是一套方法。如果你有興趣,Enterprise Big Data Analyst 課程就是你學習機器學習基礎的開始利用數據產生價值,其實不是資訊專業的專屬 (陳昇瑋先生遺著中的迷思二),任何行業都需要數據的價值,數據分析已經是你所需要的基礎能力,歡迎你來關注。

--

--

吳傑
吳傑

Written by 吳傑

耳順之年,致力推廣 Enterprise Big Data Framework & BCS AI certifications 於台灣。照片當然是數多年前的。呵。

No responses yet