注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡家庭與辦公軟件大數據導論

大數據導論

大數據導論

定 價:¥43.00

作 者: 甘勇,陶紅偉 著
出版社: 中國鐵道出版社有限公司
叢編項: 全國高等院校新工科數據科學與大數據系列規(guī)劃教材
標 簽: 暫缺

購買這本書可以去


ISBN: 9787113263133 出版時間: 2019-11-01 包裝: 平裝
開本: 16開 頁數: 224 字數:  

內容簡介

  隨著大數據時代的到來,涌現出多元化海量數據。大數據背后隱藏著大量的經濟利益,尤其是 通過數據整合、分析與挖掘,其所表現出的數據整合與控制力量已經遠超以往。本書詳細介紹了數據 科學與大數據技術的詳細內容。共分為9章,主要內容包括:大數據與數據科學、數據采集與數據預 處理、數據存儲、大數據處理平臺、數據分析、數據可視化、數據安全與隱私、大數據應用、數據 思維。 本書適合作為數據科學與大數據專業(yè)及其相關專業(yè)本科生教材,也可供從事相關專業(yè)的教學、科 研和工程技術人員參考。

作者簡介

  甘勇:教授、鄭州工程技術學院副校長,長期工作在教學科研一線,主持的大學計算機和程序設計基礎課程被評為河南省精品課程、河南省精品資源共享課,擔任教育部計算機課程教學指導委員會委員、河南省計算機類專業(yè)和網絡空間安全專業(yè)教學指導委員會副主任,兼任中國計算機學會理事、河南省計算機學會副理事長、河南省計算機教育研究會副理事長。榮獲過優(yōu)秀教學成果二等獎、2項河南省優(yōu)秀教學成果特等獎、3項河南省優(yōu)秀教學成果二等獎。陶紅偉:鄭州輕工業(yè)大學計算機與通信工程學院副教授、博士,主要研究方向包括大數據分析、軟件可信度量與評估、信息安全。主持省部級以及橫向項目5項,作為主要成員參與國家863重點項目子課題、國家自然科學基金重大研究計劃集成項目子課題、國家863項目和國家自然科學基金項目等。

圖書目錄

第1章 大數據與數據科學 / 1
1.1 大數據概述 / 1
1.1.1 大數據的概念 / 2
1.1.2 大數據的特征 / 2
1.1.3 大數據的結構類型 / 3
1.2 大數據的發(fā)展 / 4
1.3 大數據處理的挑戰(zhàn) / 5
1.4 數據科學的概念 / 6
1.5 數據科學的由來 / 7
1.6 數據科學的應用場景 / 9
1.6.1 行業(yè)數據 / 9
1.6.2 數據服務 / 10
小結 / 11
習題 / 11
第2章 數據采集與數據預處理 / 12
2.1 數據采集和數據預處理概述 / 12
2.1.1 數據采集概述 / 12
2.1.2 數據預處理概述 / 13
2.2 數據采集技術 / 15
2.2.1 網絡數據采集技術 / 15
2.2.2 日志數據采集技術 / 23
2.3 數據預處理技術 / 28
2.3.1 數據清洗 / 28
2.3.2 數據集成 / 30
2.3.3 數據變換 / 30
2.3.4 數據規(guī)約 / 32
小結 / 33
習題 / 33
第3章 數據存儲 / 34
3.1 數據存儲概述 34
3.1.1 數據存儲的發(fā)展歷程 / 34
3.1.2 數據存儲模型 / 36
3.2 大數據存儲 / 36
3.2.1 海量數據存儲關鍵技術 / 37
3.2.2 分布式文件系統(tǒng) / 37
3.3 分布式數據庫 / 41
3.3.1 HBase 分布式數據庫 / 42
3.3.2 MongoDB 分布式 數據庫 / 45
3.3.3 Hive 分布式數據 倉庫 / 47
小結 / 49
習題 / 49
第4章 大數據處理平臺 / 50
4.1 概述 / 50
4.2 大數據的處理平臺架構 / 51
4.2.1 技術架構 / 51
4.2.2 開源平臺 / 52
4.3 大數據的批量處理 / 54
4.3.1 批量計算的概念 / 54
4.3.2 批量計算的軟件系統(tǒng) / 55
4.4 大數據的流式計算 / 63
4.4.1 流式計算的概念 / 63
4.4.2 流式計算的軟件系統(tǒng) / 64
4.5 大數據的混合處理計算 / 68
4.5.1 混合處理計算的概念 / 68
4.5.2 混合處理計算的軟件系統(tǒng) / 69
小結 / 78
習題 / 79
第5章 數據分析 / 80
5.1 數據分析概述 / 80
5.1.1 數據分析的概念和作用 / 80
5.1.2 數據分析的類型 / 81
5.1.3 數據分析的流程 / 81
5.2 統(tǒng)計數據分析方法 / 83
5.2.1 描述統(tǒng)計 / 83
5.2.2 相關分析 / 84
5.2.3 回歸分析 / 88
5.2.4 主成分分析 / 92
5.3 數據挖掘算法 / 96
5.3.1 決策樹 / 96
5.3.2 K-Means 算法 / 101
5.3.3 Apriori 算法 / 106
5.3.4 神經網絡 / 111
5.4 數據分析工具 / 113
小結 / 114
習題 / 114
第6章 數據可視化 / 117
6.1 數據可視化概述 / 117
6.1.1 數據可視化的基本特征 / 119
6.1.2 數據可視化的作用 / 120
6.1.3 數據可視化的流程 / 123
6.2 數據可視化方法 / 126
6.2.1 文本可視化 / 126
6.2.2 網絡可視化 / 129
6.2.3 時空數據可視化 / 131
6.2.4 多維數據可視化 / 134
6.3 數據可視化軟件與工具 / 136
6.3.1 Excel / 137
6.3.2 NodeXL / 137
6.3.3 Processing / 138
6.3.4 R / 139
6.3.5 ECharts / 139
6.3.6 Wolfram Mathematica / 141
小結 / 141
習題 / 142
第7章 數據安全與隱私 / 143
7.1 大數據安全概述 / 143
7.1.1 大數據安全體系結構 / 148
7.1.2 大數據安全 / 150
7.2 數據安全協議 / 157
7.3 數據隱私 / 159
7.4 數據信息共享與隱私信息融合 / 160
7.5 云環(huán)境下的大數據安全與隱私保護 / 163
小結 / 165
習題 / 165
第8章 大數據應用 / 166
8.1 互聯網商業(yè)應用 / 166
8.1.1 用戶畫像 / 166
8.1.2 大數據精準營銷 / 169
8.1.3 互聯網金融 / 171
8.2 行業(yè)大數據 / 173
8.2.1 教育大數據 / 173
8.2.2 電力大數據 / 174
8.2.3 醫(yī)療大數據 / 177
8.3 人工智能應用 / 179
8.3.1 語音識別和機器翻譯 / 179
8.3.2 共享經濟 / 180
8.3.3 智慧城市 / 183
小結 / 187
習題 / 188
第9章 數據思維 / 189
9.1 大數據時代的挑戰(zhàn) / 189
9.2 大數據時代的思維變革 / 194
9.2.1 第四范式 / 194
9.2.2 數據的混雜性 / 195
9.2.3 樣本與總體 / 196
9.2.4 數據的相關關系與因果關系 / 197
9.2.5 大數據與幸存者偏差 / 198
9.3 大數據激發(fā)創(chuàng)造力 / 199
9.3.1 大數據預測電影票房 / 199
9.3.2 利用大數據治理紐約 / 200
9.3.3 大數據助力總統(tǒng)競選 / 202
9.4 數據科學展望 / 204
9.4.1 開放數據運動 / 204
9.4.2 數據科學家所需的專業(yè)技能 / 206
9.4.3 數據科學的發(fā)展前景 / 208
小結 210
習題 210
參考文獻 / 211

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.shuitoufair.cn 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號