注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡數據庫數據分析實戰(zhàn):基于EXCLE和SPSS系列工具的實踐

數據分析實戰(zhàn):基于EXCLE和SPSS系列工具的實踐

數據分析實戰(zhàn):基于EXCLE和SPSS系列工具的實踐

定 價:¥59.00

作 者: 紀賀元 著
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111566670 出版時間: 2017-06-01 包裝: 平裝
開本: 16開 頁數: 224 字數:  

內容簡介

  本書是針對于非統計科班出身的企業(yè)人員講述數據分析和挖掘的著作,也是諸多數據挖掘書籍中為數不多的穿插大量真實實踐應用案例和場景的著作。全書分為三大部分:第一部分是基礎篇(第1章和第2章),主要介紹數據分析的概念、術語、方法、模型等,為后續(xù)的內容展開奠定基礎。第二部分是制表篇(第3章~第5章),介紹數據的采集原則、數據整理以及常用數據報表的制作方法和技巧。第三部分是數據分析篇(第6章~第14章),這是本書的重點內容,囊括了從數據掃描、數據標注到異常值分析、回歸等常用的、有代表性的功能,并以案例形式展示在數據分析過程中使用上述功能的思路、方法和技巧,指導讀者進行實戰(zhàn)操練。

作者簡介

  紀賀元,數據分析專家,從事數據分析與挖掘的培訓和咨詢多年,曾在通信行業(yè)長期從事數據分析與挖掘的建模分析工作。在EXCEL、SPSS、MODELER、EVIWS、VBA、SAS等方面有長期的使用經驗,擅長分析模型和算法的優(yōu)化工作。曾經主持過多個數據分析、數據報表、市場調查項目。

圖書目錄

前言
第1章 什么是數據分析1
1.1 一眼就看到結論還需要數據分析嗎1
1.1.1 企業(yè)數據量2
1.1.2 數據復雜度2
1.1.3 數據顆粒度3
1.2 數據分析能給我們帶來什么4
1.2.1 了解數據的整體狀況4
1.2.2 快速查詢數據5
1.2.3 數據之間關系的探索5
1.2.4 業(yè)務預測6
1.3 數據分析的幾大抓手6
1.3.1 足夠多的數據6
1.3.2 數據質量6
1.3.3 合適的工具7
1.3.4 分析結果的呈現7
1.4 數據分析的流程7
1.4.1 數據采集7
1.4.2 數據整理8
1.4.3 制表11
1.4.4 數據分析11
1.4.5 數據展示(呈現)12
1.5 如何成為數據分析高手12
1.5.1 “拳不離手,曲不離口”12
1.5.2 熟練掌握常用工具12
1.5.3 最好能編點程序13
1.5.4 一定要通曉業(yè)務14
第2章 數據分析的理論、工具、模型15
2.1 基本概念和術語15
2.1.1 基本概念15
2.1.2 術語22
2.2 選擇稱手的軟件工具26
2.2.1 EXCEL27
2.2.2 VBA27
2.2.3 Access27
2.2.4 SPSS28
2.2.5 XLSTAT29
2.2.6 Modeler29
2.2.7 R語言30
2.3 在分析需求和模型之間搭起橋梁30
2.3.1 識別需求30
2.3.2 分解需求30
2.3.3 選擇工具和模型31
第3章 數據采集與整理32
3.1 數據采集的幾條重要原則32
3.1.1 要足夠“復雜”32
3.1.2 要足夠“細”33
3.1.3 要有“跨度”33
3.1.4 要有可行性34
3.2 用“逐步推進法”推測需要的數據34
3.3 耗時耗力的數據整理過程35
3.3.1 重復、空行、空列數據刪除36
3.3.2 缺失值的填充和分析39
3.3.3 數據間邏輯的排查45
3.4 數據量太大了怎么辦47
3.4.1 放到數據庫中處理47
3.4.2 用專業(yè)工具處理47
3.4.3 數據抽樣51
第4章 數據分析的基礎:制表(上)53
4.1 以數據合并為目標的制表53
4.1.1 跨工作表合并53
4.1.2 跨工作簿合并55
4.2 以數據篩選為目標的制表56
4.2.1 普通數據篩選57
4.2.2 高級篩選60
4.2.3 計算篩選62
4.2.4 函數篩選63
4.3 以獲得概要數據為目標的制表64
4.3.1 分類匯總方法64
4.3.2 數據透視表匯總68
第5章 數據分析的基礎:制表(下)70
5.1 “七個百分比”讓你懂得大部分表格類型70
5.1.1 行總計的百分比70
5.1.2 列總計的百分比73
5.1.3 全部總計的百分比74
5.1.4 父行(列)的百分比74
5.1.5 累計占比75
5.1.6 環(huán)比78
5.1.7 同比79
5.2 分組功能經常讓分析峰回路轉81
5.2.1 文本的分組81
5.2.2 等步長的數據分組83
5.2.3 不等步長的數據分組86
5.2.4 日期型的分組88
5.3 隨意生成各種派生指標89
5.3.1 添加字段89
5.3.2 添加項91
5.4 從大數據庫中挑選要分析的數據:Microsoft Query92
5.5 強大的SQL97
5.5.1 SQL的基本語法97
5.5.2 SQL的應用97
第6章 數據掃描:給數據做體檢100
6.1 在EXCEL中給數據做掃描100
6.2 SPSS中給數據做掃描103
6.3 在Modeler中給數據做掃描105
6.4 其他相應的指標108
第7章 數據標注:給數據上色110
7.1 大數據塊的整體標注111
7.1.1 突出顯示單元格規(guī)則111
7.1.2 特殊數據選取規(guī)則112
7.2 根據業(yè)務邏輯在數據中標注上色113
7.2.1 數據條、色階、圖標集的應用113
7.2.2 規(guī)則的理解115
7.2.3 根據業(yè)務需求改變規(guī)則118
7.3 采用公式實現復雜強大的數據標注119
7.3.1 理解邏輯表達式的含義119
7.3.2 復雜邏輯公式的應用120
7.4 如何在一張表格中實現多種標注規(guī)則123
7.4.1 多規(guī)則的應用123
7.4.2 如何理解“遇真則停止”125
第8章 找到數據中的“特殊分子”127
8.1 什么是異常值127
8.2 異常值的判斷標準128
8.3 用繪圖技巧找到異常值129
8.3.1 散點圖129
8.3.2 面板圖130
8.4 用公式函數法發(fā)掘異常值135
8.5 三倍標準差法137
第9章 相關分析與決策樹140
9.1 Pearson相關140
9.1.1 應用場景141
9.1.2 輸出指標的解析141
9.2 典型相關分析145
9.2.1 操作步驟145
9.2.2 結果解讀147
9.3 決策樹149
9.3.1 什么時候需要用決策樹149
9.3.2 決策樹的操作和指標解釋150
第10章 聚類155
10.1 多維度數據的分類怎么辦155
10.1.1 低維度數據的分類方法155
10.1.2 高維度數據的分類需求157
10.1.3 常用的聚類操作介紹157
10.2 聚類的煩惱1:如何面對數量級差別大的數據165
10.3 聚類的煩惱2:如何判斷聚類的質量167
第11章 回歸168
11.1 如何尋找現有數據的內在規(guī)律168
11.1.1 什么是數據擬合169
11.1.2 多元線性回歸171
11.2 logistic回歸173
11.2.1 回歸(客戶“買”與“不買”)173
11.2.2 多元logistic回歸(多個品牌的選擇)176
11.2.3 多元有序logistic回歸181
第12章 關聯分析183
12.1 因果關系的弱化183
12.2 關聯分析的指標184
12.2.1 支持度184
12.2.2 置信度185
12.2.3 提升度185
12.3 什么樣的數據適合做關聯分析186
12.3.1 商超數據186
12.3.2 金融數據186
12.3.3 生產質量數據187
12.4 關聯分析的具體操作187
第13章 預測191
13.1 什么是預測,預測的準確度高嗎191
13.2 移動平滑193
13.3 指數平滑194
13.3.1 二次指數平滑194
13.3.2 三次指數平滑195
13.4 對周期性數據的分解198
13.5 ARIMA預測法201
第14章 高級繪圖技巧206
14.1 怎樣才算圖畫得好206
14.2 雙軸圖的技巧和運用207
14.3 不同數量級數據的高效對比展示211
14.4 數據標簽的妙用215
14.5 圖形中的重點標注221
14.6 繪圖美學—多點審美素養(yǎng)222
14.6.1 整體布局222
14.6.2 線型的選擇223
14.6.3 色彩對比223
后記 數據分析經驗之我見224

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.shuitoufair.cn 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號