注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)科學導論:探索數(shù)據(jù)的奧秘

數(shù)據(jù)科學導論:探索數(shù)據(jù)的奧秘

數(shù)據(jù)科學導論:探索數(shù)據(jù)的奧秘

定 價:¥45.00

作 者: 黃曉林,劉斌,劉欽,陳穎,葛云 著
出版社: 清華大學出版社
叢編項: 面向新工科的電工電子信息基礎(chǔ)課程系列教材
標 簽: 暫缺

ISBN: 9787302561699 出版時間: 2020-09-01 包裝: 平裝
開本: 16開 頁數(shù): 180 字數(shù):  

內(nèi)容簡介

  本書通過完整、規(guī)范的數(shù)據(jù)科學項目的流程來組織全書體系結(jié)構(gòu),涵蓋數(shù)據(jù)科學項目的全過程,包括問題提出與目標制定、凝練前提假設(shè)和設(shè)計數(shù)據(jù)方案、探索性數(shù)據(jù)分析、建模與分析、性能評價、結(jié)果詮釋與展示。佐以豐富的案例分析和模擬項目訓練,啟發(fā)學生主動思考,培養(yǎng)學生在實踐中樹立嚴謹?shù)目茖W思維方式及數(shù)據(jù)科學流程。 本書除了可作為本科生數(shù)據(jù)科學基礎(chǔ)課、理工通識課教材外,還面向所有對數(shù)據(jù)科學有濃厚興趣的人群,以及各行各業(yè)中有大體量數(shù)據(jù)分析需求的人群。

作者簡介

  黃曉林,南京大學電子科學與工程學院副教授,長期從事信號處理與數(shù)據(jù)分析工作,發(fā)表SCI學術(shù)論文30多篇,主持縱向科研項目4項,獲國家授權(quán)方面專利5項,軟件著作權(quán)1項。目前主講南京大學電子科學與工程學院本科生課程《計算方法》、《數(shù)據(jù)科學導論》,曾經(jīng)講授《數(shù)據(jù)庫應用》《生物醫(yī)學電子學》等課程。

圖書目錄

第1章緒論
1.1為什么要研究數(shù)據(jù)科學
1.2基本概念
1.2.1數(shù)據(jù)
1.2.2大數(shù)據(jù)
1.2.3數(shù)據(jù)科學
1.3數(shù)據(jù)科學項目涉及的人員及其任務
1.4數(shù)據(jù)科學項目流程
1.4.1確定問題
1.4.2制定目標
1.4.3搜集數(shù)據(jù)
1.4.4探索性數(shù)據(jù)分析
1.4.5建立模型
1.4.6性能評價
1.4.7結(jié)果展示
1.4.8部署模型
1.5數(shù)據(jù)科學項目中的數(shù)據(jù)流
1.6本書內(nèi)容、采用工具和目標人群
思考題
第2章問題與目標
2.1用戶層面的問題與目標
2.2數(shù)據(jù)科學層面的問題與目標
思考題
第3章數(shù)據(jù)獲取
3.1前提假設(shè)與數(shù)據(jù)方案設(shè)計
3.1.1前提假設(shè)
3.1.2數(shù)據(jù)方案設(shè)計
3.1.3數(shù)據(jù)獲取的可行性分析
3.1.4確定數(shù)據(jù)構(gòu)成
3.2總體和抽樣
3.2.1總體和個體
3.2.2樣本
3.2.3無偏抽樣
3.2.4抽樣偏差
3.3混雜因素和A/B Testing
3.3.1混雜因素和辛普森悖論
3.3.2雙盲實驗和A/B Testing
思考題
第4章Python基礎(chǔ)
4.1Python的下載與安裝
4.2常用工具包的下載與安裝
4.3Jupyter Notebook
4.4Python的常用數(shù)據(jù)結(jié)構(gòu)
4.4.1列表
4.4.2元組
4.4.3字典
4.4.4集合
4.4.5numpy.ndarray
4.4.6Pandas.DataFrame
4.5Python基本語法
4.5.1基本命令
4.5.2控制流和相關(guān)語法
4.6Python數(shù)據(jù)導入
4.6.1本地數(shù)據(jù)導入
4.6.2在線數(shù)據(jù)導入
4.6.3數(shù)據(jù)的連續(xù)流加載
第5章探索性數(shù)據(jù)分析
5.1數(shù)據(jù)檢查
5.1.1數(shù)據(jù)的意義及規(guī)模
5.1.2特征的數(shù)據(jù)類型及意義
5.1.3初步排除數(shù)據(jù)泄露
5.2數(shù)據(jù)預處理
5.2.1缺失處理
5.2.2異常處理
5.2.3冗余處理
5.3描述性統(tǒng)計
5.3.1位置性測度
5.3.2離散性測度
5.3.3圖形化描述統(tǒng)計
思考題
第6章建模與性能評價
6.1統(tǒng)計建模
6.1.1常見的概率密度函數(shù)
6.1.2參數(shù)估計
6.1.3假設(shè)檢驗
6.1.4phacking
6.2回歸模型
6.2.1線性回歸模型
6.2.2線性回歸模型性能評價
6.2.3線性回歸與線性相關(guān)
6.2.4邏輯回歸
6.2.5訓練集測試集劃分
6.2.6應用非數(shù)值特征作為輸入時的onehot編碼
6.3樸素貝葉斯模型
6.3.1貝葉斯定理
6.3.2高斯模型
6.3.3多項式模型
6.3.4伯努利模型
6.4分類模型的性能評價
6.4.1混淆矩陣
6.4.2指標權(quán)衡
6.4.3應用舉例
6.4.4參數(shù)區(qū)分性能評價
6.5決策樹
6.5.1決策樹工作原理
6.5.2分類任務決策樹的建模過程
6.5.3分類決策樹應用舉例
6.6有監(jiān)督學習模型與無監(jiān)督學習模型
6.7Kmeans模型
6.7.1兩個基本概念
6.7.2Kmeans迭代算法
6.8偏差方差權(quán)衡
6.8.1偏差方差困境
6.8.2過擬合與欠擬合
6.8.3K折交叉驗證
6.9參數(shù)的網(wǎng)格搜索
6.10集成學習
6.10.1孔多塞陪審團定理
6.10.2決策樹集成
思考題
第7章結(jié)果展示
7.1區(qū)分面向?qū)ο蟮慕Y(jié)果展示
7.1.1面向出資方的結(jié)果展示
7.1.2面向用戶的結(jié)果展示
7.1.3面向數(shù)據(jù)科學家的結(jié)果展示
7.2展示過程中的可視化
7.2.1展示可視化的兩個層面
7.2.2展示可視化的三點基本原則
結(jié)語
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.shuitoufair.cn 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號