第1章 實時數據倉庫技術概述
1.1 數據倉庫技術
1.1.1 數據倉庫的定義
1.1.2 數據倉庫的特點
1.1.3 數據倉庫的體系結構
1.1.4 數據倉庫的模型
1.2 實時數據倉庫技術
1.2.1 實時數據倉庫的定義
1.2.2 實時數據倉庫的新挑戰(zhàn)
1.2.3 實時數據倉庫的體系結構
1.2.4 實時數據倉庫與傳統(tǒng)數據倉庫的比較
1.3 MapReduce技術
1.3.1 MapReduce編程模式
1.3.2 MapReduce框架的實現(xiàn)
1.3.3 Hadoop
第2章 實時數據倉庫體系結構
2.1 實時數據倉庫體系結構的設計
2.2 ODS分區(qū)
2.3 雙鏡像交替分區(qū)
2.4 數據倉庫副本分區(qū)
2.5 多級緩存分區(qū)機制
2.5.1 緩存的數據新鮮度
2.5.2 緩存的更新算法
2.5.3 多級緩存分區(qū)機制的查詢
2.5.4 查詢沖突問題的解決
2.6 幾種實時數據存儲區(qū)的比較
第3章 變化數據捕獲
3.1 變化數據捕獲方法
3.1.1 基于數據源表的時間戳標注
3.1.2 基于日志的被動數據變化的捕獲
3.1.3 基于觸發(fā)器的主動數據變化的捕獲
3.2 基于LogMiner的變化數據捕獲
3.2.1 Oracle日志簡述
3.2.2 Oracle日志的兩種模式
3.2.3 LogM:iner進行日志挖掘的基本流程
3.3 基于CDC的變化數據捕獲
3.3.1 CDC工具捕獲變化數據概述
3.3.2 CDC相關的數據庫對象
3.3.3 對變化數據處理
3.3.4 CDC捕獲模塊流程設計
第4章 更新查詢調度技術
4.1 更新查詢調度技術概述
4.2 基于優(yōu)先級的更新與查詢平衡調度
4.2.1 系統(tǒng)模型
4.2.2 在線日志捕獲數據
4.2.3 系統(tǒng)性能參數
4.2.4 PBBS調度算法
4.2.5 并行一致性控制策略
4.2.6 小結
4.3 支持Qos的更新和查詢任務調度
4.3.1 概述
4.3.2 系統(tǒng)模型
4.3.3 查詢任務的時間估算
4.3.4 調度算法
4.3.5 小結
第5章 實時數據倉庫并行查詢
5.1 概述
5.2 MapRecluee的基本流程
5.3 基于MapReclUee的并行關系運算
5.3.1 選擇和投影運算
5.3.2 連接運算
5.3.3 除運算
5.3.4 聚集運算
5.4 基于分塊結構的分布式數據庫ChunkDB
5.4.1 ChunkDB的整體架構
5.4.2 ChunkDB分布式數據庫
5.5 基于ChunkDB數據庫的MapRecluee計算
5.5.1 基于ChunkDB的Maptleduee計算實現(xiàn)流程
5.5.2 DBInputFormat數據接口擴展
5.6 ChunkDB性能評估
5.6.1 評估環(huán)境
5.6.2 查詢性能評價
5.6.3 集群規(guī)模的影響
第6章 實時數據立方技術
6.1 概述
6.2 基礎知識
6.2.1 數據立方Cube
6.2.2 Dwarf數據立方
6.2.3 MapRedllice
6.3 基于MapReduee的數據立方構建
6.4 Dwarf立方的分割
6.4.1 Dwarf立方的基礎劃分
6.4.2 Dwarf立方的多維劃分
6.5 并行Dwarf數據立方
6.5.1 并行Dwarf的建立
6.5.2 并行Dwarf的查詢
6.5.3 并行Dwarf的更新
6.5.4 并行Dwarf的優(yōu)化
6.6 并行Dwarf性能分析
6.6.1 評估環(huán)境
6.6.2 Dwarf的建立和存儲性能
6.6.3 Dwarf立方的查詢性能
6.6.4 Dwarf立方的更新性能
6.6.5 集群節(jié)點數量的影響
第7章 MR-RTDWH系統(tǒng)
7.1 MR.RTDWH概述
7.2 MR-RTDwH系統(tǒng)設計
7.2.1 系統(tǒng)設計目標
7.2.2 系統(tǒng)體系結構
7.2.3 傳統(tǒng)ETL模塊
7.2.4 實時ETL模塊
7.2.5 實時數據倉庫存儲
7.2.6 更新查詢調度模塊
7.2.7 M印Reduce并行計算模塊
7.2.8 MR-RTDWH系統(tǒng)實現(xiàn)
7.3 小結
參考文獻