數據存儲與分布
企業(yè)數據架構中數據存儲與分布是重要的內容,指導企業(yè)數據中心的整體布局和規(guī)劃構建。結合企業(yè)架構之數據架構方法論和項目實踐,總結出來數據存儲和分布的主要工作包括:數據中心數據區(qū)、業(yè)務流程數據區(qū)、非結構化數據區(qū)、元數據和編碼數據區(qū)、數據展示區(qū)、控制數據區(qū)等內容。
數據中心數據區(qū),通常對相關業(yè)務源數據、主數據標準數據、指標數據等進行采集存儲,通過對數據的部分匯總,構建出基于不同分析主題的數據,并使用數據倉庫長期保存企業(yè)的數據。
業(yè)務流程數據區(qū),通常保存業(yè)務流程相關數據。
非結構化數據區(qū),通常保存媒體數據、制度文件等非結構化數據。
元數據和編碼數據區(qū),通常存儲相關主數據模型、指標數據模型及標準規(guī)范編碼,提供元數據和編碼數據標準化支撐。
數據展示區(qū),通常存儲需要分析展示的指標數據。
控制數據區(qū),通常存儲相關問題事件數據、控制流程數據及規(guī)則預警數據等。
數據流轉
數據流轉,是對企業(yè)整體數據架構中的數據流轉和共享開展的分析與設計。重點可考慮兩個維度:縱向維度和橫向維度。
縱向維度,解決各層級數據中心區(qū)的數據流轉,對業(yè)務流程數據、數據中心數據、業(yè)務控制數據及協(xié)調數據上下級流轉。
橫向維度,解決業(yè)務應用系統(tǒng)中的數據與數據中心數據區(qū)的數據交換;數據中心數據區(qū)與展示數據區(qū)的數據交換;控制數據區(qū)與數據中心數據區(qū)的數據交換及非結構化數據區(qū)的數據流轉。
數據處理
數據處理是數據架構中的核心內容。團隊結合企業(yè)架構方法論及數據架構項目經驗,對數據處理提出相關原則如下:
數據處理原則:
依據企業(yè)相關數據模型構建業(yè)務數據來源,通過數據中心統(tǒng)一采集;
對涉及獨立業(yè)務應用數據模型,采取統(tǒng)一企業(yè)數據模型集中抽??;
對存在業(yè)務應用數據模型缺失,需完善后進行補充;
相關輔助系統(tǒng)的報表類數據,可根據需求抽取至數據中心后集中處理;
對業(yè)務數據源數據模型不統(tǒng)一、編碼不一致情況,需進行數據標準化和數據關聯(lián)完善。
對新舊系統(tǒng)切換涉及的數據編碼不統(tǒng)一、數據模型無關聯(lián),可采取中間對照表及數據關聯(lián)表,做過渡階段處理。
依據數據處理原則,結合項目實踐,提煉出數據處理基本過程主要有“數據抽取、數據流轉、數據模型、數據交換、數據匯總、流程數據處理”,六個基本過程:
數據抽取,實現各業(yè)務應用系統(tǒng)源數據的抽取,通過數據模型共享交換提取分析主題源數據。
數據流轉,通常是指采用ETL工具進行數據抽取、清洗、轉換、加載等數據流轉操作。
數據模型,重點支持跨專業(yè)及綜合分析為主的分析模型構建,根據相關業(yè)務需求,構建整體的數據支持模型,建立支持分析層級、數據粒度及維度的數據模型。
數據交換,重點工作室對各業(yè)務數據開展的數據量大小、數據傳輸實效、數據整體層級監(jiān)控及相關數據交換技術的度量和安全措施考慮。
數據匯總,考慮數據模型數據的計算匯總,對相關異構業(yè)務系統(tǒng)及數據不統(tǒng)一情況所開展的統(tǒng)一標準化轉換支持。
流程數據處理,通??紤]時效性較高的業(yè)務實時數據流提取和大數據量的業(yè)務流程的數據中心采集。
企業(yè)經營數據
下面,結合項目實踐中的涉及的數據處理相關的重點內容進行闡述。“”結合物裝裝備公司的實際業(yè)務現狀及理解,對企業(yè)經營數據處理方面,提出相關建議及解決辦法。
圖 數據架構之數據處理(示意圖)
物資裝備公司從經營重點關注的主營業(yè)務、業(yè)務流程改進、綜合管控能力提升、國際化業(yè)務拓展、物流倉儲優(yōu)化、和人才保障方面綜合考慮,在數據處理上,遵從數據處理原則,運用數據處理6個基本過程進行梳理,具體體現在:
一是業(yè)務應用上考慮業(yè)務價值鏈在市場開拓、招標、采購、物流、倉儲的數據源梳理,并對業(yè)務控制數據方面的項目管理、合同管理、客戶管理、供應商管理進行有效的標準化提升。
二是通過業(yè)務流程平臺對接各個業(yè)務應用系統(tǒng)的數據管控流程,對業(yè)務標準數據不斷優(yōu)化處理,集中總部數據中心和數據倉庫的數據治理,協(xié)調各所屬單位的分部數據中心的數據優(yōu)化,提升數據質量結構上的優(yōu)化和數據的規(guī)范性。
四是運用總分結合的數據中心部署靈活性的特征,不斷強化全系統(tǒng)的數據處理能力和數據處理效率,有效提升業(yè)務系統(tǒng)的數據采集優(yōu)化,提高用戶的使用體驗。
五是整合海外總分數據中心的結構調整,對海外的相關業(yè)務系統(tǒng)和數據處理能力采取,分時段統(tǒng)計匯總分析,逐步提升海外業(yè)務數據處理能力,并強化擴展海外數據中心的自主分析能力,提升整體業(yè)務流程改進的匹配與協(xié)調。
六是引用GPS和物聯(lián)采集終端,優(yōu)化提升物流倉儲業(yè)務系統(tǒng)的數據采集范圍和采集能力,提升物流倉儲系統(tǒng)的服務能力,不斷優(yōu)化數據處理能力,分析數據算法和智能化倉儲應用。
七是引進數據分析人才,不斷提升企業(yè)經營業(yè)務的數據處理分析能力,不斷處理總部數據中心、分部數據中心、各業(yè)務系統(tǒng)的數據挖掘、數據決策、數據運營、數據智能化的人才儲備,使公司從傳統(tǒng)的物流倉儲公司轉型成為現代化智能物流倉儲公司。
總結,企業(yè)數據架構之數據處理是對數據進行相關數據抽取、數據流轉、數據模型、數據交換、數據匯總、流程數據處理方面的有效運用,解決企業(yè)數據架構在數據流相關方面的問題和困惑,為數字化企業(yè)的構建提供數據架構中的核心內核和驅動力。
通過對物資裝備公司數據架構下數據存儲與分布、數據流轉、數據處理重點內容構建,使得企業(yè)在數據處理方面獲得核心的內驅力,有效地構建了基于業(yè)務架構構建業(yè)務應用所需的數據架構能力,形成了全企業(yè)業(yè)務與IT、數據的全景化的鳥瞰圖,為后續(xù)數字化企業(yè)構建提供藍圖指導。
第三十四屆CIO班招生
北達軟EXIN網絡空間與IT安全基礎認證培訓
北達軟EXIN DevOps Professional認證培訓
責編:yangjun
免責聲明:本網站(http://www.www.gypb.net/)內容主要來自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
本網站刊載的所有內容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權歸原作者所有。任何單位或個人認為本網站中的內容可能涉嫌侵犯其知識產權或存在不實內容時,請及時通知本站,予以刪除。