非結構化數據

吳傑
Jul 27, 2021

--

來自網路的圖

根據定義,你很容易理解什麼叫做「非結構化數據」 (Unstructured Data)。人類自從有電腦以來,大多是處理「結構化數據」。因為科技的演進與人類不斷地探詢,大量的「非結構化數據」都被拿來處理,當然是為了找出更多的價值。可是,非結構化數據的處理,從技術的眼光來看,難度比較高,也更為複雜。這應該就是目前多數企業沒有涉入非結構化數據的原因。

最近看到一篇 文章 說道,可能會有廠商對你吹噓「非結構化數據」的價值。事實上,我們都應該要有一個態度,應該要理解的是:數據是用來發現價值的。也就是說,這諾大的數據海洋中,你不要只是利用二分法來看!確實,處理「非結構化數據」可能是比較困難,可是,「結構化數據」還是可能有它的價值存在。同時,大量處理「非結構化數據」導致你的成本與資源的消耗,最後你獲得了什麼?

所以,我就從 企業大數據框架數據分析的流程來看:第一步一定是先確認你的業務方向,第二步才是依據你的業務方向,來設計收集那些數據與如何找到你需要的數據。此時,你可能會找到的是結構化數據,或是非結構化數據。千萬不要反過來,非得要看某些非結構化數據的結果,因為那個結果是你設計好要用來解析業務價值的嗎?這就好像,很多人看到數據就拿自己會的工具來處理,你應該反過來想:你要分析業務問題,你應該如何設計目標?然後你才去思考你的工具,或是你需要的數據。不要忘記:數據是用來發現價值的,這個過程會有大量的成本。

--

--

吳傑
吳傑

Written by 吳傑

耳順之年,致力推廣 Enterprise Big Data Framework & BCS AI certifications 於台灣。照片當然是數多年前的。呵。

No responses yet