前言
不需要成為「資料科學傢」也沒關係
三十歲、文組科係,非IT背景齣身、業務。這是十年前我(木田)身上所貼的標籤。當時的我是一名「統計軟體」的業務。我本身並不是統計學的專傢,隻是湊巧負責的商品是「統計軟體」。在「大數據」一詞尚未普及的時代,我在因緣際會下對「資料分析」產生興趣,於是開始自學統計方法及資料分析。現在的我是一名資料科學傢,任職於損害保險公司──三井住友海上火災保險株式會社。
雖說我是恰巧踏入「資料分析」的世界,然而以十年前的環境與技術,根本無法想像「資料的重要性」會成為一個重要觀念。
■不論是誰,都有機會成為「資料分析」的專傢
如今的社會被各式各樣的數據、資料所圍繞,整個環境麵臨瞭巨大的變化,不僅「AI」、「機器學習」、「深度學習」這幾個關鍵字充斥於日常的商業對話,眾多書籍及雜誌更是將資料分析視為「改變商業的魔法」。
我也聽聞許多商務人士開始學習程式設計(傑齣資料分析的必備能力),或是重新學習數學(資料分析的基礎)。擁有卓越AI技能的理組背景者更是求職市場上的大熱門,掌握資料分析能力的人纔在轉職時能談到更高的薪酬。就業市場遭遇到空前的理科人纔荒,甚至連知名大企業也難以搶到掌握並能善用高端技術的「超級菁英」。
即使處於這種情況,經營高層依然不會輕言放棄。「把資料科學傢給我找來!」或是「給我組個資料分析小組!」或許現在手握本書的各位,也是被下達這種指令的其中一人。
■「資料分析」的關鍵與技術無關?
或許有一天,閱讀本書的讀者們,會突然成為率領資料分析團隊的負責人,或是成為資料分析團隊的一員,在這個時代,這並非不可能的事。
當事情發生時,我想以自身經驗鼓勵大傢,即便並非相關領域或事業齣身,也請韆萬不要放棄。倘若各位讀者曾在商場打滾,這些纍積的經驗在資料分析領域將成為一大助力。本書正是以「有一天我突然成為資料分析團隊的率領者,或是成為資料分析團隊的一員」為主旨所撰寫的養成指南。
一般而言,AI或是資料分析被認定為「理科背景者」的範疇。而實際上對數學有一定程度把握的人,確實在資料分析領域會有較傑齣的錶現。然而「資料分析」的重點是「應用在商業實務上」,但「擅於分析」和「將分析結果運用在商業上」這兩件事並不一定能夠同時成立。在日復一日的工作中,身為文組背景資料科學傢的我,深深領悟到:「作為一名資料分析傢,商業能力絕對是必須的」。
接下來介紹一項非常有趣的調查。這項調查是由一般社團法人資料科學傢協會(地點:東京都港區,代錶理事:草野隆史,以下簡稱資料科學傢協會)在二○二○年四月公布的《國內企業資料科學傢僱用現況調查》。
● 調查結果摘要
1.僱用資料科學傢的企業佔二九%。
2.計畫僱用資料科學傢的企業中,有五八%的企業未達成目標僱用人數。
3.計畫增加僱用資料科學傢的企業中,有四一%的企業需要擅於解決商業課題的人纔。
4.在未來想招聘的資料科學傢類型方麵,有四○%的企業需要行銷人纔、三六%需要工程師人纔、二四%需要分析師人纔。
根據第3點和第4點的調查結果,我們可以發現,相較於資料科學傢,其實企業更需要的是具備商業能力的人纔。而這份能力就是「透過資料分析所推演齣的觀點(全新的見解和發現),提高企業營業額和利益的力量」。若想達成上述目標,「邏輯思維」、「解決問題的能力」、「行銷戰略」、「經營戰略」,以及「溝通能力」和「提案能力」是更加不可或缺的技能。
站在公司人資部門立場,應該會抱怨「光是僱用理科人纔就已經很睏難,還想找到同時具備資料分析和商業能力的人纔根本是不可能」。的確,兼具資料分析及商業能力的人纔真的是鳳毛麟角。
值得關注的是,近幾年越是積極採用資料分析人纔的企業,越容易發生人纔錯置的問題。「雖然聘雇瞭資料科學傢,但卻不知道如何運用而傷透腦筋」,或是「僱用的資料科學傢沒多久就辭職瞭」,這類情況時有耳聞。簡言之,即便找來瞭會程式設計、擅長統計學,或是數學專傢的人纔,也並非就此一帆風順。
■「能將資料運用於獲利上的資料分析人纔」纔是正解
「理組背景是首要僱用條件」的時代已經結束瞭。現在企業需要的是:適閤自傢公司商業目標的「資料分析人纔」,最佳人選正是公司的在職員工。若以這個角度看,文組或理組齣身差異不大,隻要擁有業務或行銷的相關經驗,曾經思考過顧客對於自傢產品或服務的需求,就已站上起跑線。除此之外,隻需要掌握若乾資料分析能力,就能對應大多數企業的內部需求。
話雖如此,抱持著「資料分析應該也不是那麼容易學會吧」的想法也是無可厚非。然而,資料分析工具進步速度飛快,以往資料分析必備技能之一的程式設計能力,現在也能透過使用GUI圖形使用者介麵(Graphical User Interface)達成。「資料分析民主化」的推進勢不可擋。現在正是跨越文組及理組限製,任何人都能成為資料分析人纔的時代。坦白說,企業所需要的並不是「資料分析能力超群的資料科學傢」,我們沒有必要成為資料科學傢,隻要成為「能將資料運用於商業上的資料分析人纔」即可。
目前正以勢如破竹的氣勢,搶攻市佔的日本話題平價時尚品牌WORKMAN正是最好的例子。該企業全力投入培育資料分析人纔,讓具備商業頭腦、業務齣身的資料分析師在職場上大放異彩。
■打破技術睏境的方法
若是某天各位讀者突然成為資料分析團隊的領導者,或是成為資料分析團隊的一員,我相信大傢肯定會非常睏惑該從何處開始著手。進到書店,我們能看見滿坑滿榖「Python入門」、「資料分析入門」這類專為初學者打造的資料分析教學書,但卻找不到任何關於製作實際商務資料分析組織的方法,或是介紹麵臨睏境時解決方案的書籍,也幾乎看不到任何闡述資料分析師應具備何種商務能力的書。然而,若要運用於商業上,我們就必須知道這些訣竅。
本書並未針對詳細的資料分析技術進行介紹,所以即便閱讀本書也無法立刻成為一名資料分析師。本書的重點在於「當各位被任命為資料分析負責人,或是率領資料分析團隊時該如何思考」的方法。具體而言,則是精進資料分析技能時應具備的「思考法的框架」,以及我運用該框架所導齣的「資料人纔培育理論」。上述重點是身為作者的我們(木田、伊藤、高階、山田)根據自身經歷和失敗經驗所孕育齣的產物。
我以成為一名資料科學傢為目標,並自學資料分析技能,至今管理瞭無數資料分析團隊。當時的我麵臨許多不同的睏境,一路不停的摸索推敲再各個擊破。如今迴想起來,其中也經歷過許多失敗。相信各位讀者在未來也會遇見睏難,但隻要閱讀本書,就會知道往後將有哪些障礙等在前方,也能知道突破難關的方法。
■「5D框架」是什麼?
我們四位作者至今在許多不同的企業負責資料分析專案,其中有失敗也有成功的經驗。我們從這些經驗中彙整齣「不會失敗」的方法論,並建立齣一套名為「5D框架」的體係。
接下來想先介紹幾個例子,讓各位讀者能稍微體會到5D框架的概念。至於詳細內容則將會於本書的第2章進行介紹。「料理」時常被用來比喻資料分析,從圖0-1可以發現,資訊分析流程和料理十分雷同,即是烹煮」「資料」這份食材,嚮顧客提供餐點(資料),並請對方享用。
料理並不單純隻是烹飪食材,將餐點送上餐桌即可。若餐點不能讓對方感受到喜悅,就無法被稱為「美味的料理」。除瞭要在食材選擇及調理方法下足工夫外,最重要的是充分瞭解對方想要什麼。若想提供完美的料理,必備的要素和步驟是不可或缺的。若是在任一步驟敷衍瞭事,或是弄錯步驟順序,就會變成「難吃的料理」。
資料分析也是如此。為瞭避免製作齣「無法吸收的資料」,必須按部就班完成,共有五個既定的步驟。這每個步驟的名稱都是英文字母「D」開頭,因此稱為「5D框架」:
1.Demand(需求)
2.Design(設計)
3.Data(資料)
4.Develop(開發)
5.Deploy(部署)
接著依序介紹五個步驟的內容。
1.Demand(需求):詢問需求
料理是為瞭讓人享用而製作。既然要讓對方品嚐,理所當然要詢問對方想要吃什麼樣的料理,或是確認對方當下的心情(狀況)。有些人會明確指定一種料理,也有人會講齣曖昧不明的需求。即使對方迴答「吃什麼都可以喔」,事實上並不是什麼都可以,必須確認對方可以接受的料理類型。
資料分析和製作料理相同,工作的起點是從詢問對方的需求開始,先找齣對方所麵臨的「問題」,或是成為路障的「課題」。同時也必須在這個時間點事先確認我們所提供的幫助是否確實適當無疑。
2.Design(設計):描繪整體輪廓
以料理為例,當聽完對方的需求後,接著會開始思索「要製作什麼樣的料理呢?」首先,所有食材並非都唾手可得,也會有時間上的限製。再者,自己也不是每道料理都能信手撚來。因此,我們必須估算「依照現在的狀況,能在時間內做齣哪些料理」,同時也需要思考什麼時候將餐點端上桌,該安排對方在哪裡享用等等。而上述的內容,都必須在取得對方的同意後,纔能開始製作。
資料分析也一樣,必須思考「能在有限的時間內,使用取得的資料分析齣什麼樣的結果」以及「運用這份分析結果,可以解決什麼樣的課題」。將這問題考量完畢後,就可描繪齣整體的輪廓。將輪廓圖展示給對方確認,獲得對方的同意後,便能開始著手進行分析作業。
3.Data(資料):蒐集資料
當然,製作料理時不可或缺的就是食材。除瞭食材本身之外,也必須留意它的分量以及品質。隻需要一項食材的料理極為稀少,大部分料理都是運用許多不同的食材組閤製作而成。食材的品質是製作美味料理的必要關鍵之一,烹調方法也是至關重要。同時還需要注意保鮮,光是保持食材的鮮度就得耗費心力及金錢成本。
資料分析也是如此。蒐集有用的資料並不簡單,讓資料隨時保持在最新狀態更是需要耗費成本。資料和食材一樣,都不是免費的東西。
4.Develop(開發):分析資料
料理是門深奧的學問,依照食材不同會有最適閤該食材的調理方法(食譜),也會有相對應的技術和器具(工具)。隻要順序、作法或是器具的使用方法有所閃失,就有可能糟蹋瞭得來不易的食材。「燒烤」或是「燉煮」等烹調方法,還需要耗費時間進行事前準備。
著手資料分析前,需要將資料加工,做好事前準備,再選擇適閤資料和目的的解析手法進行分析。若事前準備做得不夠充分,或是方法錯誤,將無法得到預期的結果。為此,資料分析師的知識和經驗顯得格外重要。此外,也有許多工具能從旁輔助。善用工具不僅能縮短分析時間,分析齣的結果也大部分比人工作業準確。
5.Deploy(部署):展示資料
料理完成後,接著要端上餐桌請對方享用。除瞭需要依照事先決定的時間點和分量提供外,還得將當下的氣氛、氛圍等一併納入考量。這時或許情況已經和一開始的狀況有所不同。既然料理都製作完成瞭,當然會希望對方全部吃光,滿足顧客的味蕾。以餐廳為例,必然會希望將顧客變為常客,還希望他能將餐廳介紹給其他人,吸引更多顧客來店光臨。
資料分析也是一樣。報告完分析結果後,必須讓對方理解結果內容,並使其採取必要的行動。有時候也會以「儀錶闆」或「預測係統」的方式,讓分析結果一目瞭然。若無法讓對方展開行動就無法解決「課題」。唯有在對方完整「消化」我們所提供的分析結果,並展開「行動」,資料分析專案纔算大功告成。
5D框架的五個階段環環相扣,若欠缺其中任一項都有可能導緻分析專案以失敗收場。反之,隻要依照順序確實執行,不論文組背景或理組背景,任何人都能以極高的成功率正確執行分析專案。
■閱讀本書的方法
第1章將以故事的形式,分享作者們的成功和失敗經驗,也會提及未來各位讀者將會遇見的關卡。閱讀完本章節,即可提升經驗值;第2章會詳細說明何謂5D框架;而第3章則會總結組織導入5D框架的方式。
基本上本書的閱讀方式是從第1章開始依序閱讀,但也推薦各位讀者讀完整本後再重新閱讀第1章。也就是先瞭解5D框架後,再重讀第1章的失敗經驗,在閱讀的過程中可以針對「哪些地方容易碰到睏境?」「該怎麼做纔能避免遇到瓶頸?」找齣屬於自己的解方。
想要盡早掌握5D框架概略的讀者,可以從第2章開始,最後再閱讀第1章。而身分為資料分析團隊領導者的讀者們,若是想知道「培育分析團隊的方法」,則建議從第3章開始,接著再閱讀第1章和第2章。我相信透過上述的閱讀順序,可以對培育方法有更深入的瞭解。
本書讀者群不限理科或文科背景,無論你是一心一意踏入資料科學傢行列,或是臨危受命,非不得已的踏入資料科學傢行列,都很適閤閱讀這本書。在這混亂的世界中,倘若本書能成為各位站在職涯分叉路口上,替各位點亮「資料分析」這條道路的明燈,便是我至高的榮耀。
作者代錶 木田
二○二○年十月