2015 年,全球掀起了一股大數據熱潮。(圖片來源:Adobe stock)
文/高端訓
還記得2015 年,全球掀起了一股大數據熱潮,無論是台灣的主流雜誌,以至於世界的媒體,「大數據」(Big Data)都曾登上主流媒體的封面報導。這個現象,引起我極大的好奇。我工作了近30 年,為何突然出現這個新物種,而我對它好像有一點陌生。所以,我決定放下手中的工作,到大數據的源頭,去一探究竟。
很幸運的,我申請到加州大學爾灣分校的大數據學程:Data Science and Predictive Analytics。這並不是一個傳統的、充滿數學、資訊的大數據課程,而是整合資訊、統計、企業應用領域,也是爾灣分校第一次開出的課程。學校為了讓這個學程能夠成功,直接找來多位教科書的作者,在課堂上現身說法,當然課後也變成另類的粉絲與作者的見面簽名會。
大數據跟我們原來認識的有何不同。我們都讀過一個成語,叫「瞎子摸象」。一群瞎子遇到一頭象 ,摸到象腿的人,覺得大象像根柱子;摸到象鼻的人,覺得大象像根水管;摸到象耳朵的人就說﹕「你們都錯啦!大象,其實像把扇子!」
大數據,就像一頭闖入商業叢林的大象。大家都想知道,「大數據,到底是什麼?」這個問題,問不同背景的專家,回答也不一樣。所以,大數據真的是頭大象,每個人說的都不一樣。
許多人以為,網路上的數據,才叫大數據,恐怕這就見樹不見林了。大數據主要有四種來源:
第一種,是企業內部的數據。像是企業資源規劃ERP(Enterprise Resource Planning)系統裡,就有許多企業採購和生產的數據。
第二種,是企業從外部蒐集的數據。像是顧客關係管理CRM(Customer Relationship Management)系統裡,就有各種關於顧客購買行為的數據;還有各種官方發布的社會、經濟指標,以及民間組織所發布的市場及消費者研究報告等。
第三種,是網路數據(Web Data)。像是會員登入官網的時間、網友瀏覽網站、在電商購買產品,以及各種網路付款資訊等,都算網路數據。
第四種,是網絡數據(Network Data)。它跟網路數據最大的不同,是除了電腦、平板、手機、電視等四屏產生的數據之外,還有物聯網(日常物品或設備透過網際網路連接在一起)、智慧製造等網際網路以外所蒐集到的資訊都是屬於網絡數據。
所以,企業的內部與外部,以及線上和線下,這四種數據加起來,才是大數據的全貌。有人說,大數據早就存在,我們也已經在使用了,只是講對了一部分的事實,那是傳統的企業內部的ERP 及CRM 顧客資料。對於網路公司來說,則偏重在網路上的數據。
現在實體企業也有網路上的分身(如官網、粉絲頁、顧客線上消費行為等),只有整合了企業內、外,以及線上、線下,才能發揮大數據應有的價值,當然也是最困難的一步。因此,馬雲才說「大數據是未來的石油」,比的是誰先把它開採出來!
本文整理、節錄自高端訓《大數據預測行銷》一書。由時報文化授權轉載,欲閱讀完整作品,歡迎參考原書。