據(jù)研究表明,在數(shù)據(jù)分析的整個(gè)過(guò)程中,數(shù)據(jù)準(zhǔn)備會(huì)占大約80%的時(shí)間。怎樣把數(shù)據(jù)收集起來(lái),并確保數(shù)據(jù)可直接用于分析展示,是最麻煩、最耗時(shí)的事情,倘若數(shù)據(jù)未處理妥當(dāng),炫酷好看的可視化展示也毫無(wú)意義。
首先,需要由業(yè)務(wù)人員提出業(yè)務(wù)需求,并描述業(yè)務(wù)需求所需的數(shù)據(jù)內(nèi)容。其次,通過(guò)業(yè)務(wù)人員及技術(shù)人員合作,根據(jù)業(yè)務(wù)對(duì)象抽象出數(shù)據(jù)概念,定義其描述、分類與關(guān)系。技術(shù)人員根據(jù)數(shù)據(jù)概念描述、分類,抽取出數(shù)據(jù)實(shí)體,并利用ER圖描述其關(guān)系。
最后,技術(shù)人員針對(duì)數(shù)據(jù)庫(kù)特性將數(shù)據(jù)實(shí)體物化為數(shù)據(jù)庫(kù)表,支撐實(shí)際應(yīng)用。
由于互聯(lián)網(wǎng)及通信技術(shù)的飛速發(fā)展以及數(shù)據(jù)量的爆發(fā)式增長(zhǎng),各類數(shù)據(jù)也大規(guī)模增長(zhǎng),可依據(jù)相關(guān)規(guī)范對(duì)數(shù)據(jù)質(zhì)量即數(shù)據(jù)的及時(shí)性、完整性以及準(zhǔn)確性進(jìn)行限制,詳細(xì)地通過(guò)事前防范、事中監(jiān)控、事后管控3個(gè)時(shí)間段進(jìn)行監(jiān)督。
三、數(shù)據(jù)標(biāo)準(zhǔn):做統(tǒng)一根據(jù)已確定的企業(yè)核心邏輯數(shù)據(jù)模型,將模型中的數(shù)據(jù)項(xiàng)抽取出來(lái)。然后根據(jù)預(yù)定的業(yè)務(wù)數(shù)據(jù)項(xiàng)篩選方法,篩選出需要進(jìn)行業(yè)務(wù)定義的數(shù)據(jù)項(xiàng)。再根據(jù)業(yè)務(wù)對(duì)所篩選出的業(yè)務(wù)數(shù)據(jù)項(xiàng)進(jìn)行分類,產(chǎn)生用于通用數(shù)據(jù)標(biāo)準(zhǔn)及公共代碼定義的數(shù)據(jù)標(biāo)準(zhǔn)項(xiàng)清單。
而具體的通用數(shù)據(jù)標(biāo)準(zhǔn)的制定包括定義工作目標(biāo)、流程、及模版,其分類標(biāo)準(zhǔn)則根據(jù)數(shù)據(jù)在業(yè)務(wù)中的使用頻度和業(yè)務(wù)需求,參考業(yè)界模型,通過(guò)匯總分析,對(duì)通用數(shù)據(jù)進(jìn)行分類,形成統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)在數(shù)據(jù)層面的定義,并以數(shù)據(jù)項(xiàng)自然分類為基礎(chǔ),對(duì)數(shù)據(jù)進(jìn)行分類。
主數(shù)據(jù)是描述核心業(yè)務(wù)實(shí)體的數(shù)據(jù),是企業(yè)內(nèi)跨業(yè)務(wù)重復(fù)使用的數(shù)據(jù),存在于多個(gè)異構(gòu)的應(yīng)用系統(tǒng)中,是關(guān)鍵數(shù)據(jù),而不是全部數(shù)據(jù);是操作性數(shù)據(jù),動(dòng)態(tài)參與業(yè)務(wù)流程,而不是靜態(tài)數(shù)據(jù)。
在企業(yè)中主數(shù)據(jù)是全員共享,全員服務(wù)的重要數(shù)據(jù),與其他數(shù)據(jù)分離,作為單獨(dú)的部分進(jìn)行管理。
數(shù)據(jù)的生命周期包括數(shù)據(jù)創(chuàng)建、數(shù)據(jù)使用、數(shù)據(jù)歸檔、數(shù)據(jù)銷毀4個(gè)階段。而數(shù)據(jù)在生命周期內(nèi)有效則可以滿足業(yè)務(wù)操作和管理分析的需要;滿足對(duì)歷史數(shù)據(jù)查詢相關(guān)政策和管理制度的要求;滿足審計(jì)管理要求;減少數(shù)據(jù)冗余,提高數(shù)據(jù)一致性;減少存儲(chǔ)、硬件、運(yùn)維等方面基礎(chǔ)設(shè)施投入;提升應(yīng)用系統(tǒng)性能,提高響應(yīng)速度。因此,數(shù)據(jù)生命周期的管理必不可少。
數(shù)據(jù)是數(shù)據(jù)倉(cāng)庫(kù)的靈魂,它不僅提供了數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)結(jié)構(gòu)的邏輯層,也提供了數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建和使用規(guī)則。
為了使數(shù)據(jù)倉(cāng)庫(kù)中各個(gè)軟件能夠無(wú)縫地合作,必須在數(shù)據(jù)層進(jìn)行有效的集成。所以,研究數(shù)據(jù)的作用與意義相當(dāng)重要.數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),即是對(duì)數(shù)據(jù)資源的描述,按其描述對(duì)象的不同可以分3大類:技術(shù)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和管理數(shù)據(jù)。
數(shù)據(jù)治理的一個(gè)重要作用是保障數(shù)據(jù)的安全。應(yīng)該從企業(yè)級(jí)、體系化視角開(kāi)展數(shù)據(jù)安全管理頂層設(shè)計(jì)。
數(shù)據(jù)統(tǒng)一分類分級(jí)后,通過(guò)數(shù)據(jù)鑒權(quán)來(lái)控制某一類數(shù)據(jù)可以被哪些系統(tǒng)調(diào)取,可以被哪些人員查看,可以被哪些部門共享,對(duì)不符合權(quán)限的對(duì)象進(jìn)行限制,有效地防止數(shù)據(jù)泄露風(fēng)險(xiǎn)。
報(bào)名熱線/微信:18024510019