您好,登錄后才能下訂單哦!
隨著企業與數字科技融合程度的逐漸加深,越來越多的企業在數字化轉型之路上感到前所未有的焦慮。他們相信組織已經擁有了具有經濟價值的數據資源,期望它能像其他資產那樣為組織帶來更多的未來利益。
諸如員工資產,與數據一樣,員工也是企業資產的重要組成部分。只不過相較于數據資產管理在國內企業中仍然處于早期階段。大部分企業在員工的選育用留上已經形成了一套標準化流程和相對成熟的管理策略。基于此,我們是不是應該考慮像管理員工資產那樣,以相同的方式處理數據呢?這時,數據策略顯得尤為重要。
一、數據策略的定義
數據策略是用于獲取、集成、存儲、保護、管理、監控、分析、使用和操作數據的方法。現代而全面的數據策略所涉及的不僅僅是數據,它是定義人員、流程和技術的路線圖,闡明了數據將如何實現和激發業務策略。
具體包括:闡明目標愿景和實現該愿景的實用指南,明確闡述成功標準和關鍵績效指標,這些指標可用于評估和合理化所有后續數據計劃。而不包含針對特定技術問題的詳細解決方案。隨著企業目標的發展,數據戰略并非一成不變,需要緊跟企業的技術創新和運作方式。
二、為什么企業要建立數據策略
鑒于前面闡述的背景,數據策略與員工的選育用留策略一樣,都是為了更科學地管理企業資產。如果沒有策略,組織將被動應對各業務部門提出的數據要求。從前臺業務、市場,到中后臺的財務、供應鏈、人力資源,都會向一個部門提需求,可能涉及到某種數據分析、主數據管理、商業智能、數據治理、數據質量計劃等。
導致數據部門每天對外要理解業務數據需求的內涵,竭力排期滿足,對內要運維所使用的陳舊工具和系統,保證其正常運行,每天不堪重負。一旦出現數據質量、元數據等問題,就會被挑戰得體無完膚,甚至會升級到能力和信任的高度。更為關鍵的是,如果無法及時正確地支持這些計劃,很容易導致企業做出錯誤的商業決策。
三、誰來制定、推動數據策略
請不要將企業范圍的數據策略僅僅交給首席信息官(CIO),為什么?數據不僅僅是IT資產,而是一種企業資產,數據策略在一定程度上是一種企業戰略。
DataPipeline認為,CEO和董事會需要深刻理解快速將數據戰略落地的意義和風險,并著手構建下述組織架構,鼓勵相應的文化和創新。
CEO相較于其他企業角色,既要關注生存,也要關注發展,而數據很難做到立竿見影,所以平衡短期收益與長期發展考驗的是CEO的智慧。如果CEO在公布決策時都是引用數據,并對企業內部的數據創新非常熟悉,那么數據策略已經成功了一半,否則其他人的努力有極大概率會付諸東流。
CDO由CEO領導,直接負責公司組織內部數據發展策略落地的詳細路徑和整體節奏,根據業務模式確定合規要求、需求滿足的價值、速度、流程、以及自動化、智能化技術路線的選擇。這里一定要注意滿足業務需求的速度和質量,由于數據需求的挑戰較大,太多CDO無法在一定時間,一定業務范圍內快速達成CEO、董事會、業務部門希望看到的效果。沒有一個好的起點,首席數據官的工作就會喪失前進的節奏,陷于和業務部門就數據的上收、使用等流程長期討論和拉鋸的泥潭中,造成惡性循環,使這個崗位變成高危職位。據DataPipeline觀察,很多企業開始設立CDO的崗位,并嘗試通過數據帶來業務增長,客觀來說,這和其他高管職位一樣,是一個機遇與挑戰并存的情況。
數據合規與標準委員會由CEO領導,并由公司的業務線領導、法務領導、首席數據官組成,詳細制定出數據使用的邊界、自由度和數據質量標準。負責隨著業務的發展保持最高頻率(一般是一周一次)的討論更新,同時使用自動化的工具將規則同步至數據系統中。如果業務的變化無法從合規層面保持一致,就會逐步成為限制數據使用的瓶頸。這里的挑戰在于不讓規則討論過于大而全,要盡快在一定范圍內達成共識,逐步推動部分范圍內規則地快速落地,否則會使愿景的落地失去前進節奏。
數據部門由首席數據官領導,包括數據工程師,分析師和數據科學家。數據工程師負責使用符合時代挑戰的自研或者商業的工具,確保業務用戶可以自助式地完成數據全生命周期的使用和管理。同時負責企業內外的數據源能自動高效地集成融合,快速滿足業務取數、用數需求,另外通過保證元數據、主數據、數據血緣與業務發展時刻保持一致,讓業務準確無誤地理解數據語義。
他們不僅要確保大數據平臺的負載均衡、穩定性,可以隨時響應業務對數據模型的計算和查詢需求。還要遵循標準委員制定的標準,通過手工制定規則和各種算法確保數據質量并盡可能做到前置預警。最后,也是非常重要的一點,在應對業務部門的需求時,需要有一套“定價體系”。因為數據支持業務的發展探索是存在成本的,但目前業務部門對此并無感知,更核算不出ROI。在成本面前,很容易篩選出真需求,排出優先級,并且在后續服務中理清ROI。這條路舉步維艱,但又勢在必行,否則數據部門的業務價值困境始終會存在。
有時數據部門在沒有設立首席數據官的情況下也由CIO領導,這時有一個職責劃分藝術,每個企業的情況都不同,但CDO的重點職責是在合適的企業內帶領數據組用數據快速產生業務價值。CIO的職責范圍更廣,但專精的領域不在該點上。
業務部門中應當擁有能深入理解業務的分析師和科學家,自助使用數據部門提供的工具,這時使用門檻會不斷降低,取數用數的難度和周期也會大幅下降,技能的要求一般是SQL級別。因此業務部門需要更加理解數據,并構思數據可以應用到自身業務發展的角度,再通過管理數據使用的全生命周期,在實踐中不斷總結。挑戰在于如何能快速用數據高效地帶來業務價值,通過解耦來擺脫發展受到數據部門效率制約的現狀。
四、數據策略中的數據融合策略
企業希望在未來以數據支持數據應用和數據業務,但前提是能夠隨時隨心快速提取使用數據。在此過程中存在一些壁壘,諸如技術、組織、文化等。如果沒有提前思考這些難點,在后續朝目標努力時,會遇到很大的阻力,甚至有可能讓項目流產。
在搞清楚為什么制定數據融合策略之后,接下來我們將從以下幾方面展開:
Who:組織中,誰將參與數據融合?是否有具備編程知識的IT專家解決所有數據融合任務?還是需要使業務部門的員工能夠自己使用數據融合工具?一旦實施,潛在的技術風險和實施周期是什么?這些問題將對您選擇購買的數據融合解決方案的類型產生重大影響。
What:哪些數據可能需要集成?在DataPipeline看來,我們反對大而全,支持企業按需制定非常靈活的數據融合策略。企業需要反向從業務角度去思考,從全局角度梳理清楚在未來一到三年或更長期的時間內,有哪些業務目標希望通過數據去驅動,這些數據包括哪些數據,這些數據都存在于哪里,避免重復建設。
如果只存在幾個數據孤島,對企業來說,最具成本效益的策略可能是選擇可以滿足特定需求的基本數據交換或ETL工具。但是,如果需要集成許多不同的孤島(或者不同類型的數據),那么最好使用功能更為全面的數據融合平臺。
When:何時進行數據融合?企業一旦制定了數據策略,接下來數據融合策略將會被擺在一個非常高的位置上。因為,如果不做數據融合,其余事情將會舉步維艱,但從時間上要做通盤考慮,進行一個頂層設計,然后再按階段逐步進行。
如果要創建數據倉庫,則數據融合可能會在分析之前進行。如果要創建基于Hadoop或類似技術的數據湖,以原始未更改的形式存儲數據,則將在運行分析工作負載之前進行一些數據融合。目前許多企業都有數據倉庫和數據湖,選擇何種體系結構將影響數據融合所需的技術類型。
Where:數據融合將在哪里進行?云和本地并不是一個矛盾,因為現在有許多公司既有本地的IDC(數據中心),又有云上,甚至是多云的架構。企業需要選擇一種能夠支持本地部署、云上部署、Docker,在容器大的平臺上多管齊下的數據融合工具。另外,該工具的現代化和智能化程度還應該適應企業當中非常復雜多變的環境。
How:如何進行數據融合?這個問題最為復雜,因為它涉及到工具、文化和流程。關于員工,作為企業和組織的戰略性資源,我們并非要將每個人都訓練成高水平、有經驗、訓練有素的數據工程師。而應注重培養其數據意識,知道如何使用數據,如何去發揮數據的價值。
同時企業應該采取靈活易用、穩定的數據融合工具。面對再厲害的人才,如果沒有匹配相應的工具和方法論,在工作中也很難游刃有余。未來企業需要多思考何種工具,何種平臺,何種工作方式能讓組織盡快釋放數據效能。
公司需要結合自身的發展階段、信息化建設水平以及人員的素養等情況,來選擇自己的解決方案。
如果研發人員較多,可選擇的范圍相對會比較廣泛。面對開源和商業的數據融合工具,您需要根據企業的需求和對生產的要求進行選擇。開源是很好的方式,可以先從這里嘗試做起,但是對于業務的連續性要求和有些生產級別的要求,可能就需要商業工具。
另外,關于一些技術考量點,可以看這篇文章:構建實時數據集成平臺時,在技術選型上的考量點請添加鏈接描述
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。