注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡圖形圖像、多媒體、網頁制作視頻/音頻/流媒體基于Rattle的可視化數據挖掘技術

基于Rattle的可視化數據挖掘技術

基于Rattle的可視化數據挖掘技術

定 價:¥39.00

作 者: 張冬慧
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302474326 出版時間: 2017-07-01 包裝:
開本: 頁數: 字數:  

內容簡介

  數據挖掘技術近年來發(fā)展異常迅猛,已成為大數據時代*熱門的技術和研究熱點,不僅產生了大量不同類型、功能強大的數據挖掘算法,而且推動了眾多數據挖掘工具軟件的發(fā)展。在這些軟件中,R語言是數據挖掘領域*重要的軟件之一。Rattle是一種用于數據挖掘的R語言的圖形交互界面,或稱為可視化數據挖掘工具。Rattle給出了從數據整理到模型評價的完整解決方案。本書主要介紹如何用Rattle包進行數據挖掘,全書共9章,通過大量精選實例,循序漸進、全面系統地講述數據挖掘過程。本書不僅是從事數據挖掘和大數據分析工程技術人員開發(fā)相關系統的技術資料,也可作為學習數據挖掘和大數據分析等課程的參考用書。

作者簡介

暫缺《基于Rattle的可視化數據挖掘技術》作者簡介

圖書目錄


目 錄第1章緒論11.1數據挖掘的認識11.1.1為什么要進行數據挖掘11.1.2數據挖掘過程11.1.3數據挖掘九大定律31.2R與Rattle31.2.1R語言31.2.2R語言的基本語法41.2.3R語言的優(yōu)勢101.2.4Rattle包101.3本章小結12 第2章入門指南132.1概述132.2認識Rstudio132.2.1Rstudio的界面132.2.2R腳本編輯區(qū)142.2.3R命令控制臺152.2.4工作空間162.2.5結果展示區(qū)182.3認識Rattle202.3.1Rattle的安裝與啟動202.3.2選項卡212.3.3工具欄24基于Rattle的可視化數據挖掘技術目錄2.3.4菜單欄242.3.5屬性面板262.4本章小結26 第3章數據準備283.1概述283.2數據283.2.1術語283.2.2變量293.2.3數據集303.3可用數據303.4數據質量313.4.1數據質量概述313.4.2數據質量評估維度313.4.3影響數據質量的因素313.5數據匹配323.6數據倉庫333.7數據訪問343.8載入數據353.8.1載入CSV數據353.8.2載入數據庫363.8.3載入SPSS類型數據383.8.4載入自帶數據集383.8.5載入網頁數據383.8.6載入其他格式的數據393.9本章小結39 第4章數據理解414.1概述414.2匯總數據414.2.1查看數據的簡單信息414.2.2查看數據的細節(jié)信息434.2.3查看數據的分布信息434.2.4查看數據的缺失值444.3數據分布圖464.3.1數值型變量分布圖464.3.2分類變量分布圖504.3.3散點圖矩陣524.4相關分析534.4.1相關矩陣和相關圖534.4.2缺失值的相關分析554.4.3相關樹564.5主成分分析604.6交互式探索數據624.6.1安裝GGobi634.6.2安裝rggobi634.6.3實驗指導644.7本章小結64 第5章數據檢驗665.1概述665.2KS正態(tài)性檢驗675.3Wilcoxon檢驗685.4t檢驗705.5F檢驗725.6本章小結73 第6章數據變換756.1概述756.2取值范圍調整776.3缺失值填充796.4變量類型轉換816.4.1數值變量離散化816.4.2分類變量指標化816.4.3分類變量合并836.4.4分類變量和數值變量互相轉換836.4.5變量和數據的刪除836.5離群點數據的處理846.6本章小結86 第7章數據建模877.1概述877.2聚類模型967.2.1背景967.2.2Kmeans聚類967.2.3Ewkm聚類1007.2.4層次聚類1017.2.5雙向聚類1057.3關聯規(guī)則挖掘1067.3.1背景1067.3.2基本術語1077.3.3關聯規(guī)則分類1087.3.4Apriori算法1087.3.5實驗指導1097.4傳統決策樹模型1147.4.1背景1147.4.2ID3算法1157.4.3C4.5算法1167.4.4實驗指導1177.5隨機森林決策樹模型1207.5.1背景1207.5.2隨機森林算法1217.5.3實驗指導1227.6自適應選擇決策樹模型1267.6.1背景1267.6.2Boosting算法1277.6.3Adaboost算法1277.6.4實驗指導1287.7SVM1317.7.1背景1317.7.2SVM算法1317.7.3實驗指導1337.8線性回歸模型1347.8.1背景1347.8.2一元線性回歸方法1357.8.3實驗指導1377.9神經網絡模型1387.9.1背景1387.9.2人工神經網絡模型1397.9.3實驗指導1427.10本章小結143 第8章模型評估1478.1概述1478.2數據集1488.3混淆矩陣1498.3.1二分類混淆矩陣1498.3.2模型評價指標1508.3.3多分類混淆矩陣1518.4風險圖1518.4.1風險圖的作用1518.4.2實驗指導1528.5ROC曲線1548.5.1ROC曲線的定義1548.5.2ROC曲線的作用1548.5.3實驗指導1558.6其他模型評估圖1568.7本章小結157 第9章模型部署1599.1概述1599.2模型的應用1599.3轉換為PMML1619.4電商數據挖掘案例1629.4.1背景1629.4.2數據理解1629.4.3數據準備1639.4.4清洗數據1669.4.5探索數據1679.4.6數據建模1729.5本章小結174 參考文獻175

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.shuitoufair.cn 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號