大數據時代的來臨,數據已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。隨著高校信息化的發展,學校教學、科研、后勤等管理和服務系統建設初具規模,經過多年建設和應用,規范了業務管理流程,提升了業務管理效率,也積累了大量數據資源。隨著高校從規模擴張轉向內涵式發展,如何合理配置資源、實現教育資源共享,使資源能最大限度地發揮效用,已成為高校在激烈競爭中需要解決的重要問題。高校面向管理與服務的信息化已經不再滿足于事務處理和信息查詢,而需要利用積累的大量數據進行相關分析,將其轉換成有用的信息和知識,為學校管理和決策提供有力支撐,提升高校數據服務的能力。所以如何利用這些寶貴的數據資源為高校管理與決策提供服務,已成為目前高校信息化建設的重要課題。
數據分析服務、智能決策支持應用是高校信息化發展的高級應用階段,眾多高校在這方面已經開始了探索,并且取得了初步成效,但是由于建設方法和過程不規范、系統架構不合理、應用需求不明確、核心技術瓶頸等問題,導致高校的數據服務和智能決策支持應用普遍較弱。而數據倉庫是智能決策支持應用的基礎平臺,上海財經大學信息化辦公室從2008年開始,在高校數據倉庫建設方面進行了深入探索和實踐,積累了較為豐富的經驗,取得了較為顯著的應用成效。本書定位是高校信息化建設單位實施數據倉庫項目的指導類書籍,重點介紹高校數據倉庫建設與實施過程中的相關內容,包括數據倉庫項目的需求分析該如何開展、高校數據倉庫設計與開發、數據質量管理,以及核心業務應用案例等內容。
本書針對目前高校建設數據倉庫的普遍問題,結合上海財經大學數據倉庫建設的實踐,通過深入分析高校數據服務需求,提出基于數據倉庫的高校數據服務系統技術方案,探索適合高校業務特點的數據服務系統實施方法,形成高校數據服務系統實施和應用的典型案例,從而推動和促進數據服務在高校中的廣泛應用。全書主要從數據倉庫需求分析、設計、開發、管理與應用幾個方面進行闡述。
本書由上海財經大學信息化辦公室組織撰寫,多位作者參與本書撰寫。其中,第1章由王珊珊、陳云、吳先斌撰寫,第2章由吳先斌撰寫,第3章由王珊珊撰寫,第4章由高亮撰寫,第5章由吳先斌、高亮撰寫,第6章由高亮、吳先斌、陳云撰寫。全書由陳云總撰定稿。同時,感謝項目合作單位上海吉貝克信息技術有限公司提供的相關資料。
由于作者水平有限,書中錯誤在所難免,懇請專家和廣大讀者批評指正。
目錄
第1章緒論
1.1數據倉庫概念
1.2高校數據倉庫建設背景與意義
1.3高校進入大數據時代
1.3.1大數據概念與特征
1.3.2大數據關鍵技術
1.3.3大數據對高校的影響
1.4高校大數據研究展望
1.4.1高校大數據應用
1.4.2高校大數據應用需要注意的問題
第2章數據倉庫相關技術及原理
2.1數據倉庫系統架構
2.2數據提取、轉換、加載
2.2.1數據提取、轉換、加載的定義與設計
2.2.2數據提取、轉換、加載的管理
2.3數據倉庫模型設計
2.3.1概念模型設計
2.3.2邏輯模型設計
2.3.3物理模型設計
2.4數據倉庫應用技術
2.4.1數據倉庫應用系統技術架構
2.4.2數據倉庫OLAP分析技術
2.4.3數據挖掘技術
第3章高校數據倉庫需求分析
3.1需求分析原則
3.2需求獲取
3.3需求分析
3.4需求論證
第4章高校數據倉庫設計與開發
4.1數據倉庫建設
4.1.1建設過程
4.1.2開發流程
4.2數據倉庫架構
4.2.1系統架構
4.2.2數據架構
4.3數據主題規劃
4.3.1主題劃分方法
4.3.2高校數據倉庫主題
4.4源數據分析
4.4.1源系統分析
4.4.2源表分析
4.4.3源字段分析
4.5數據模型設計
4.5.1操作數據層建模
4.5.2基礎層建模
4.5.3集市層建模
4.6ETL設計、開發、測試
4.6.1ETL架構
4.6.2操作數據層ETL
4.6.3基礎層ETL
4.6.4集市層ETL
4.6.5ETL調度
4.7數據倉庫運行監控
4.8報表設計開發
4.8.1報表需求定義
4.8.2報表詳細設計
4.8.3報袁開發
第5章高校數據倉庫管理
5.1元數據管理
5.1.1元數據的概念
5.1.2元數據管理系統
5.2數據質量管理
5.2.1數據質量衡量標準
5.2.2數據質量問題產生的原因
5.2.3數據質量監控系統
5.2.4數據質量管理制度
5.3數據倉庫運維管理