數(shù)據(jù)模型,數(shù)字化轉(zhuǎn)型的核心能力
業(yè)界數(shù)字化轉(zhuǎn)型已經(jīng)進(jìn)入深水區(qū),數(shù)據(jù)越來越受到大家重視,由于數(shù)據(jù)中臺等等概念的興起,大家越來越回到數(shù)據(jù)的根本問題“數(shù)據(jù)模型”。
一、什么是數(shù)據(jù)模型
我們可以先看一下生活中的模型的例子,房屋平面圖、地圖等都是很好的模型的示例。
對于下圖的房屋平面圖來說,我們基本看一眼就能知道這是一個三室兩廳兩衛(wèi)的房子,有一個玄關(guān)和一個陽臺,哪里是門,哪里是墻,哪里是窗戶,每個房間的平米數(shù)是多少,全部都用各種符號表示得一清二楚。
對于地圖來說,我們也知道綠色的部分一般都表示公園,藍(lán)色的部分表示湖,黃色的粗線表示高速公路……
圖 1生活中的“模型”(圖片來源于網(wǎng)絡(luò))
數(shù)據(jù)模型是用于描繪、溝通數(shù)據(jù)需求的一組簡單易懂、標(biāo)準(zhǔn)的,并且便于計算機(jī)實現(xiàn)的標(biāo)準(zhǔn)符號的集合。
我們都知道數(shù)據(jù)庫很強(qiáng)大,但數(shù)據(jù)在其中的關(guān)系卻錯綜復(fù)雜,成千上萬個表通過各種關(guān)系或約 束互連以形成復(fù)雜的結(jié)構(gòu)。沒有數(shù)據(jù)模型,利益相關(guān)者很難看到現(xiàn)有數(shù)據(jù)庫的結(jié)構(gòu)、理解關(guān)鍵概念,當(dāng)需要描述數(shù)據(jù)需求的時候,也很難準(zhǔn)確地表達(dá)出來,這也是數(shù)據(jù)模型很重要的一個最主要的原因。
下圖是一個簡單數(shù)據(jù)模型的示例:
圖 2一個關(guān)于學(xué)生-出勤-課程的數(shù)據(jù)模型(圖片來源:數(shù)據(jù)建模經(jīng)典教程,Steve Hoberman)
二、數(shù)據(jù)模型的幾個關(guān)鍵形容詞
1. 數(shù)據(jù)模型是一組符號集合
與實物模型不同,數(shù)據(jù)模型不是等比例模擬出來的真實事物,而是一組能表示數(shù)據(jù)需求、數(shù)據(jù)結(jié)構(gòu)的符號集合。
在房屋平面圖中,中間有條線的矩形表示窗戶,用直角扇形表示門。在數(shù)據(jù)模型中,用矩形框或圓角矩形表示實體;用線以及線上的符號表示實體之間的關(guān)系、基數(shù)或約束;用寫在線上的詞或詞組表示標(biāo)簽,所有的這些符號組成了各種各樣的數(shù)據(jù)模型。
2. 數(shù)據(jù)模型是用來描繪、溝通數(shù)據(jù)需求的
建筑設(shè)計師在蓋房之前通過房屋平面圖描繪建筑需求,建筑工人就可以看著這些平面圖來蓋房子。房子蓋完之后還可以把房屋平面圖展示給客戶,這樣即使客戶不去現(xiàn)場看實體房就可以大概了解房屋結(jié)構(gòu)。數(shù)據(jù)模型也是專門設(shè)計出來描繪數(shù)據(jù)需求,給技術(shù)實現(xiàn)人員來建造數(shù)據(jù)庫,并且實現(xiàn)數(shù)據(jù)需求無障礙溝通的“圖紙”。
3. 數(shù)據(jù)模型是簡單易懂、標(biāo)準(zhǔn)的
模型之所以可以讓人們實現(xiàn)快速溝通,是因為足夠標(biāo)準(zhǔn)并且簡單易懂。
自古以來,無論是蓋房子還是造火箭,都不可能事先把龐大復(fù)雜的實物拿過來給大家介紹,相反只需要通過一些簡單標(biāo)準(zhǔn)的符號,就可以表示清楚具體的意思。一旦讀者看到標(biāo)準(zhǔn)的模型語言,他們能馬上能開始討論這個模型是否準(zhǔn)確,而不需要浪費任何額外的時間去探討建模用的符號是什么意思。
4. 數(shù)據(jù)模型是便于計算機(jī)實現(xiàn)的
數(shù)據(jù)模型從一個抽象層次描述了數(shù)據(jù)的靜態(tài)特征、動態(tài)行為和約束條件,最終是要通過技術(shù)實現(xiàn)人員轉(zhuǎn)化成能被計算機(jī)理解的程序語言,并且在數(shù)據(jù)庫中實現(xiàn)出來的。所以在設(shè)計數(shù)據(jù)模型的時候,必須將便于計算機(jī)實現(xiàn)作為模型設(shè)計的原則之一。
三、為什么需要數(shù)據(jù)模型?
企業(yè)中經(jīng)常會出現(xiàn)以下問題:
1. 不同技術(shù)背景和業(yè)務(wù)經(jīng)驗的各類人員在討論數(shù)據(jù)需求時缺少一種有效的溝通工具,在討論中經(jīng)常因為對各種符號理解不一致,導(dǎo)致溝通效率低下,不同觀點之間很難協(xié)調(diào),達(dá)成共識。
2. 當(dāng)系統(tǒng)出現(xiàn)故障或發(fā)現(xiàn)數(shù)據(jù)問題時,沒有可以觀察系統(tǒng)的整體視角,技術(shù)人員對當(dāng)前數(shù)據(jù)庫內(nèi)的狀況全然不知,導(dǎo)致系統(tǒng)問題排查困難,數(shù)據(jù)問題無從下手。
3. 不同部門對業(yè)務(wù)規(guī)則的理解不一致,關(guān)于“客戶”、“產(chǎn)品”等關(guān)鍵概念含義多種多樣,數(shù)據(jù)庫中同名不同義,同義不同名現(xiàn)象隨處可見,極大地影響了數(shù)據(jù)的識別和應(yīng)用。
4. ……
數(shù)據(jù)模型作為不同技術(shù)背景和業(yè)務(wù)經(jīng)驗的各類人員有效溝通數(shù)據(jù)需求的重要媒介,可以幫助描述與溝通數(shù)據(jù)需求、增加數(shù)據(jù)的精確性與易用性、降低系統(tǒng)的維護(hù)成本并增加數(shù)據(jù)可重用性,極大地減少了以上問題出現(xiàn)的頻率。
1. 數(shù)據(jù)模型可以幫助不同人員描述與溝通數(shù)據(jù)需求
在企業(yè)中,來自不同部門、具有不同技術(shù)背景的業(yè)務(wù)人員、業(yè)務(wù)分析師、數(shù)據(jù)分析師、建模人員、架構(gòu)師、數(shù)據(jù)庫設(shè)計人員、開發(fā)人員等各類人員經(jīng)常需要共同討論數(shù)據(jù)問題與數(shù)據(jù)需求。數(shù)據(jù)模型作為一種理想的溝通工具,可以快速使相關(guān)人員達(dá)成共識,跳過對符號的理解而直接討論深層需求。
2. 數(shù)據(jù)模型可以增加數(shù)據(jù)的精確性與易用性
數(shù)據(jù)模型中的精確定義為數(shù)據(jù)提供了一個規(guī)范的結(jié)構(gòu),數(shù)據(jù)建模過程本身是發(fā)現(xiàn)、分析、界定數(shù)據(jù)需求的過程,可以幫助解釋數(shù)據(jù)上下文的邊界,減少數(shù)據(jù)訪問和數(shù)據(jù)存儲時發(fā)生數(shù)據(jù)異常的可能性。通過說明數(shù)據(jù)中的結(jié)構(gòu)和關(guān)系,數(shù)據(jù)模型使數(shù)據(jù)更易于使用。
3. 數(shù)據(jù)模型可以降低系統(tǒng)維護(hù)成本、提升資產(chǎn)可重用性
數(shù)據(jù)模型有助于我們從整體視角了解業(yè)務(wù)與數(shù)據(jù)現(xiàn)狀,并有助于人們分析目前可能存在的業(yè)務(wù)與數(shù)據(jù)問題、分析修改現(xiàn)有數(shù)據(jù)結(jié)構(gòu)是否可行和每次修改可能會帶來的影響,降低維護(hù)成本。
另外,數(shù)據(jù)模型以相對標(biāo)準(zhǔn)精確的形式保留了關(guān)于企業(yè)系統(tǒng)或項目的記憶,這些記憶可以作為可重用性資產(chǎn)供未來項目使用,從而降低構(gòu)建新應(yīng)用程序的成本。
四、總結(jié)
作為不同技術(shù)背景與業(yè)務(wù)經(jīng)驗的各類人員有效溝通數(shù)據(jù)需求的重要媒介,數(shù)據(jù)模型越來越成為數(shù)字化轉(zhuǎn)型的核心能力。數(shù)據(jù)模型有助于人們描述與溝通數(shù)據(jù)需求、增加數(shù)據(jù)的精確性與易用性、降低系統(tǒng)的維護(hù)成本并增加可重用性。(作者:龔菲,數(shù)據(jù)領(lǐng)域工作者)
編輯 : 周寶冰
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作媒體供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。
新聞排行榜
-
2021-01-21 11:23
-
2018-09-28 11:33
-
2018-09-28 11:33
-
2018-09-28 11:33
-
2018-09-28 11:33
新聞熱門推薦
-
2021-01-21 11:23
-
2018-09-28 11:33
-
2018-09-28 11:33
-
2018-09-28 11:33
-
2018-09-28 11:33