[Big Data]導入Big Data前應該想清楚的幾件事

導入Big Data前應該想清楚的幾件事
檢視資料,我的資料有哪些?分別是什麼用途?
你的需求,Big Data幫的上忙嗎?
已有的資料,怎麼運用?沒有的資料,如何取得?取得哪些?又如何運用?
那些暫時用不上的資料怎麼辦?

前幾天參加IBM的研討會,這個研討會上午的議程其實很精采,把Big Data講的很清楚,連同IBM已有的成果及案例都說了,但我對他們活動的那句slogan「科技Ready,商機就Ready」不是很滿意,因為事情一直都不是這個樣子,任何一個科技的發展,技術都只是基本要素,而不是關鍵要素,就像之前的雲端運算一樣,技術早就ready了,但怎麼用才是關鍵呀,現在的Big Data也是一樣的,你需要的是思考這項科技究竟可以幫上你什麼?本篇我就我個人的角度來談談這件事情吧。

image

檢視資料,我的資料有哪些?分別是什麼用途?
在看Big Data時,我先粗略的將企業資料的使用狀況分成三大類:
第一類:已經取得且在使用的資料,包含日常的庫存資料、訂單資料、客戶資料,也就是一般的系統就能處理的營運資料
第二類:已經取得但未使用的資料,像是系統執行的log檔、過期的資料(幾年前的財務資料、客戶對產品的建議資料)、郵件中的附件等,這些一直都在,但卻沒有被實際運用的資料
第三類:有些資料你可能不知道取得對我們會不會有幫助(客戶在社群網路上對產品的評論),或者不知道該如何取得(賣場中客戶的動線),這些資料可能涉及到公司價值活動的改變,也可能會影響到整個組織運作

你的需求,Big Data幫的上忙嗎?
Big Data在做分析時,其實歷史資料很多時候也能派上用場的,例如分析趨勢用來預測,分析log找出系統異常的週期與現象,而多數的系統大多只針對目前用的到的資料做處理,極少使用這些「過期」的歷史資料,但這些看似無關緊要的資料,卻可能讓你在「必要」的時候派上用場,而什麼叫必要的時候?這是提供技術解決方案的供應商所無法解決的,你只能靠自己或者顧問來診斷,還記得之前在談雲端運算時,我也曾說過,雲端運算並不是關鍵,關鍵是你面對的問題,能否透過雲端運算的技術得到解決,面對Big Data,你還是回歸到需求面,先想想你企業中有什麼樣的問題,需要這樣的解決方案來幫助你克服。

已有的資料,怎麼運用?沒有的資料,如何取得?取得哪些?又如何運用?
擅長運用資料的公司,早已經有自己的一套資料運用方法,多了Big Data這樣的技術,只是更快更好的做好那些事情,但若我們的公司並沒有太多關於資料運用的經驗,那我們就必須回歸到我們的策略、管理、服務、產品、業務等各個層面來檢視我們需要哪些支持?而這些支持需要什麼樣的資料?我們是否擁有這些資料?我們能對他做分析嗎?對於手邊沒有的資料,我們如何取得與保存?你得從企業經營管理的角度去思考,而不是從技術角度思考這些事情。

那些暫時用不上的資料怎麼辦?
或許你會這樣想:「不知道用不用的上,反正先留著吧。」,這是很多人在購物時的想法,有些便宜的東西就先買了,或許有一天用的上,你也知道這樣的想法往往讓你多花了冤枉錢,在面對資料時,可能也是一樣的狀況,你以為資料保存、備份是不用錢的嗎?當你決定取得一堆資料時,你就已經決定要花錢了,而保存與管理也是一項大議題,所以資料治理(Data Governance)也將成為你該思考的問題,接下來你要思考哪些要留?要留多久?全部都留不是不行,但你就要負擔相對的成本。

如果你對廠商題的Big Data解決方案動心了,不妨先思考一下以上幾個問題,或許會讓你有新的思維。

游舒帆 (gipi)

探索原力Co-founder,曾任TutorABC協理與鼎新電腦總監,並曾獲選兩屆微軟最有價值專家 ( MVP ),離開職場後創辦探索原力,致力於協助青少年培養面對未來的能力。認為教育與組織育才其實息息相關,都是在為未來儲備能量,2018年起成立為期一年的專題課程《職涯躍升的關鍵24堂課》,為培養台灣未來的領袖而努力。