注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件大數(shù)據(jù)技術基礎

大數(shù)據(jù)技術基礎

大數(shù)據(jù)技術基礎

定 價:¥48.00

作 者: 鄂海紅,宋美娜,歐中洪 著
出版社: 北京郵電大學出版社
叢編項: 普通高等教育“十三五”規(guī)劃教材
標 簽: 暫缺

ISBN: 9787563558780 出版時間: 2019-10-01 包裝: 平裝
開本: 16開 頁數(shù): 字數(shù):  

內(nèi)容簡介

  《大數(shù)據(jù)技術基礎》圍繞大數(shù)據(jù)技術基礎,重點介紹了大數(shù)據(jù)存儲系統(tǒng)(分布式文件系統(tǒng)和NoSQL數(shù)據(jù)庫)、大數(shù)據(jù)處理框架(Hadoop的MapReduce、Spark及實時處理框架Storm和Flink)、大數(shù)據(jù)倉庫技術(Hive、Druid等)、大數(shù)據(jù)多維分析(Kylin)、大數(shù)據(jù)可視化技術和大數(shù)據(jù)綜合應用等,以及當今主流的大數(shù)據(jù)平臺構建技術和開源組件實踐知識,可以指導讀者全面、系統(tǒng)地掌握大數(shù)據(jù)各層的實現(xiàn)方案,開展各領域的大數(shù)據(jù)實踐。《大數(shù)據(jù)技術基礎》可作為計算機學科相關專業(yè),特別是數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的教材。

作者簡介

  鄂海紅,博士,北京郵電大學計算機學院 副教授;科技部現(xiàn)代服務業(yè)共性服務聯(lián)盟,副秘書長;中國通信標準化協(xié)會TC11-WG1副組長。長期從事大數(shù)據(jù)工程與數(shù)據(jù)分析、機器學習與人工智能服務、云計算與分布式系統(tǒng)領域的研究工作,有扎實寬廣的理論基礎和科研項目實踐能力。作為課題負責人及主研人,完成科研項目累計34項(其中,國家課題13項),累計發(fā)表SCI/EI論文62篇;申請國家發(fā)明專利34項,軟著登記25項;正式發(fā)布國家行業(yè)標準16項。曾獲得省部級特等獎獎勵 “中國服務業(yè)科技創(chuàng)新獎”,教育部“高等學校科學研究優(yōu)秀成果獎”二等獎、“中國通信標準化協(xié)會科學技術獎”三等獎;教育部博士點基金資助;北京市“青年英才計劃”首批資助。

圖書目錄

第1章 大數(shù)據(jù)概述
本章思維導圖
1.1 大數(shù)據(jù)簡介
1.1.1 大數(shù)據(jù)的發(fā)展歷程
1.1.2 大數(shù)據(jù)的定義與特征
1.1.3 大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別
1.2 大數(shù)據(jù)平臺應具備的能力
1.3 大數(shù)據(jù)平臺架構
1.4 Hadoop生態(tài)系統(tǒng)
1.5 大數(shù)據(jù)應用
1.5.1 互聯(lián)網(wǎng)大數(shù)據(jù)應用
1.5.2 金融行業(yè)大數(shù)據(jù)應用
1.5.3 醫(yī)療行業(yè)大數(shù)據(jù)應用
1.5.4 智慧交通大數(shù)據(jù)應用
本章課后習題
本章參考文獻
第2章 大數(shù)據(jù)存儲——分布式文件系統(tǒng)及NoSQL數(shù)據(jù)庫
本章思維導圖
2.1 分布式文件系統(tǒng)
2.1.1 HDFS相關概念
2.1.2 HDFS體系結構
2.1.3 HDFS存儲機制
2.1.4 HDFS讀/寫操作
2.1.5 HDFS數(shù)據(jù)導入
2.2 NoSQL數(shù)據(jù)庫
2.2.1 KeyValue模型
2.2.2 KeyDocument 模型
2.2.3 KeyColumn模型
2.2.4 圖模型
2.3 列族數(shù)據(jù)庫
2.3.1 列族數(shù)據(jù)庫簡介
2.3.2 HBase的基本原理
2.3.3 HBase的數(shù)據(jù)模型
2.4 鍵值數(shù)據(jù)庫
2.4.1 鍵值數(shù)據(jù)庫簡介
2.4.2 選擇鍵值數(shù)據(jù)庫的原因
2.4.3 Redis的數(shù)據(jù)結構簡介
2.4.4 Redis的數(shù)據(jù)持久化
2.4.5 Redis的數(shù)據(jù)復制
2.5 文檔數(shù)據(jù)庫
2.5.1 文檔數(shù)據(jù)庫簡介
2.5.2 MongoDB的數(shù)據(jù)類型
2.5.3 MongoDB的數(shù)據(jù)復制
2.6 圖數(shù)據(jù)庫
2.6.1 圖數(shù)據(jù)庫簡介
2.6.2 圖數(shù)據(jù)庫的優(yōu)勢
2.6.3 Neo4j的基本元素與概念
2.6.4 Cypher簡介
本章課后習題
本章參考文獻
第3章 大數(shù)據(jù)處理——MapReduce處理框架
本章思維導圖
3.1 MapReduce的發(fā)展背景
3.2 MapReduce框架
3.3 MapReduce的編程模型
3.3.1 MapReduce初析
3.3.2 MapReduce的運行機制
3.3.3 MapReduce的相關問題
3.4 MapReduce的集群調(diào)度
3.4.1 Hadoop1.x的傳統(tǒng)集群調(diào)度框架
3.4.2 Hadoop2.x的集群調(diào)度框架YARN
3.4.3 Hadoop作業(yè)調(diào)度器
本章課后習題
本章參考文獻
第4章 大數(shù)據(jù)處理——分布式內(nèi)存處理框架Spark
本章思維導圖
4.1 Spark簡介
4.1.1 Spark介紹
4.1.2 提出Spark的原因
4.1.3 Spark中的關鍵術語
4.1.4 Spark的優(yōu)點
4.2 Spark框架
4.2.1 Spark框架圖
4.2.2 Spark運行圖
4.2.3 Spark任務調(diào)度方法
4.3 RDD概念理解
4.3.1 RDD介紹
4.3.2 RDD的操作
4.3.3 RDD的存儲
4.3.4 RDD分區(qū)
4.3.5 RDD優(yōu)先位置
4.3.6 RDD依賴關系
4.4 RDD操作
4.4.1 RDD創(chuàng)建
4.4.2 轉(zhuǎn)換操作
4.4.3 行動操作
4.5 Scala語言
4.5.1 Scala介紹
4.5.2 Scala基本語法
4.5.3 Scala編寫Spark示例
4.6 Spark SQL簡介
4.6.1 Spark SQL與Shark的對比
4.6.2 Spark SQL的優(yōu)勢
4.6.3 Spark SQL生態(tài)
4.7 MLlib簡介
4.7.1 MLlib介紹
4.7.2 MLlib支持機器學習算法
本章課后習題
本章參考文獻
第5章 大數(shù)據(jù)處理——實時處理框架
本章思維導圖
5.1 實時處理架構
5.1.1 基本概念
5.1.2 批量和流式計算
5.1.3 系統(tǒng)生態(tài)簡介
5.2 Storm框架
5.2.1 Storm的基本術語和概念
5.2.2 Storm特性及運行原理
5.2.3 消息的生命周期
5.2.4 消息的可靠性保障
5.3 Flume分布式日志收集
5.3.1 Flume的基本術語和概念
5.3.2 源
5.3.3 通道
5.3.4 接收器
5.4 Kafka分布式消息隊列
5.4.1 Kafka的基本術語和概念
5.4.2 生產(chǎn)者
5.4.3 消費者
5.4.4 數(shù)據(jù)傳遞的可靠性保障
5.5 Spark Streaming框架
5.5.1 Spark Streaming架構
5.5.2 輸入數(shù)據(jù)源
5.5.3 DStream的轉(zhuǎn)換操作
5.5.4 輸出存儲
5.5.5 容錯機制
5.6 Flink框架
5.6.1 Flink架構
5.6.2 Client
5.6.3 JobManager
5.6.4 TaskManager
本章課后習題
本章參考文獻
第6章 大數(shù)據(jù)查詢——分布式數(shù)據(jù)查詢
本章思維導圖
6.1 分布式數(shù)據(jù)查詢簡介
6.2 Hive分布式數(shù)據(jù)倉庫
6.2.1 Hive概述
6.2.2 Hive內(nèi)部介紹
6.2.3 Hive架構介紹
6.2.4 HiveQL:數(shù)據(jù)定義
6.2.5 HiveQL:數(shù)據(jù)導入
6.2.6 HiveQL:查詢
6.3 Druid時序數(shù)據(jù)倉儲
6.3.1 Druid概述
6.3.2 架構詳解
6.3.3 數(shù)據(jù)攝入
6.3.4 數(shù)據(jù)查詢
6.4 Drill分布式實時查詢
6.4.1 使用Apache Drill的原因
6.4.2 Drill架構與原理
6.4.3 Drill核心模塊
6.4.4 使用Drill實現(xiàn)查詢
本章課后習題
本章參考文獻
第7章 大數(shù)據(jù)分析——Kylin分布式多維數(shù)據(jù)分析
本章思維導圖
7.1 使用Apache Kylin的原因
7.2 Kylin學習的前奏
7.2.1 數(shù)據(jù)倉庫的概念與產(chǎn)生需求
7.2.2 數(shù)據(jù)倉庫與數(shù)據(jù)分析型系統(tǒng)
7.2.3 多維數(shù)據(jù)分析
7.2.4 OLAP與數(shù)據(jù)立方體
7.3 Kylin工作原理
7.3.1 Cube與Cuboid
7.3.2 工作流程
7.4 Kylin架構
7.5 Kylin快速入門
7.5.1 在Hive中準備數(shù)據(jù)
7.5.2 設計數(shù)據(jù)模型
7.5.3 創(chuàng)建Cube
7.5.4 構建Cube
7.5.5 查詢Cube
7.6 增量構建
7.6.1 設計增量Cube
7.6.2 觸發(fā)增量構建
7.6.3 管理Cube碎片
7.7 查詢和可視化
7.7.1 Web GUI
7.7.2 Rest API
7.7.3 ODBC
7.7.4 通過Tableau訪問Kylin
7.8 Cube優(yōu)化
本章課后習題
本章參考文獻
第8章 數(shù)據(jù)可視化
本章思維導圖
8.1 數(shù)據(jù)可視化定義及分類
8.1.1 數(shù)據(jù)可視化定義
8.1.2 數(shù)據(jù)可視化分類
8.2 數(shù)據(jù)可視化基礎
8.2.1 數(shù)據(jù)可視化流程
8.2.2 可視化中的數(shù)據(jù)
8.2.3 可視化的基本圖表
8.2.4 視圖的交互
8.3 信息可視化分類
8.3.1 時空數(shù)據(jù)可視化
8.3.2 層次和網(wǎng)絡數(shù)據(jù)可視化
8.3.3 文本和文檔可視化
8.4 在商業(yè)智能中的數(shù)據(jù)可視化應用
8.4.1 商業(yè)智能可視化的基本元素
8.4.2 儀表盤的設計準則
8.5 數(shù)據(jù)可視化的實現(xiàn)
8.5.1 數(shù)據(jù)可視化工具
8.5.2 ECharts
8.5.3 Plotly
本章課后習題
本章參考文獻
第9章 大數(shù)據(jù)應用系統(tǒng)案例——互聯(lián)網(wǎng)應用大數(shù)據(jù)系統(tǒng)構建
本章思維導圖
9.1 互聯(lián)網(wǎng)業(yè)務背景介紹
9.2 案例的大數(shù)據(jù)平臺技術體系架構
9.2.1 數(shù)據(jù)采集
9.2.2 數(shù)據(jù)存儲
9.2.3 數(shù)據(jù)計算
9.2.4 數(shù)據(jù)應用
本章課后習題
本章參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.shuitoufair.cn 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號