注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)(第2版)

Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)(第2版)

Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)(第2版)

定 價(jià):¥129.00

作 者: 宋天龍 著
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111627760 出版時(shí)間: 2019-07-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  這是一本將數(shù)據(jù)分析技術(shù)與數(shù)據(jù)使用場(chǎng)景深度結(jié)合的著作,從實(shí)戰(zhàn)角度講解了如何利用Python進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)化運(yùn)營(yíng)。 暢銷(xiāo)書(shū)全新、大幅升級(jí),第1版近乎100%的好評(píng),第2版不僅將Python升級(jí)到了新的版本,而且對(duì)具體內(nèi)容進(jìn)行了大幅度的補(bǔ)充和優(yōu)化。作者是有10余年數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)的資深大數(shù)據(jù)專(zhuān)家,書(shū)中對(duì)50余個(gè)數(shù)據(jù)工作流知識(shí)點(diǎn)、14個(gè)數(shù)據(jù)分析與挖掘主題、4個(gè)數(shù)據(jù)化運(yùn)營(yíng)主題、8個(gè)綜合性案例進(jìn)行了全面的講解,能讓數(shù)據(jù)化運(yùn)營(yíng)結(jié)合數(shù)據(jù)使用場(chǎng)景360°落地。 全書(shū)一共9章,分為兩個(gè)部分: 第一部分(第1-4章) Python數(shù)據(jù)分析與挖掘 首先介紹了Python和數(shù)據(jù)化運(yùn)營(yíng)的基本知識(shí),然后詳細(xì)講解了Python數(shù)據(jù)獲?。ńY(jié)構(gòu)化和非結(jié)構(gòu)化)、預(yù)處理、分析和挖掘的關(guān)鍵技術(shù)和經(jīng)驗(yàn),包含10大類(lèi)預(yù)處理經(jīng)驗(yàn)、14個(gè)數(shù)據(jù)分析與挖掘主題,50余個(gè)知識(shí)點(diǎn)。 第二部分(第5~9章) Python數(shù)據(jù)化運(yùn)營(yíng) 這是本書(shū)的核心,詳細(xì)講解了會(huì)員運(yùn)營(yíng)、商品運(yùn)營(yíng)、流量運(yùn)營(yíng)和內(nèi)容運(yùn)營(yíng)4大主題,以及提升數(shù)據(jù)化運(yùn)營(yíng)價(jià)值的方法。每個(gè)運(yùn)營(yíng)主題中都包含了基本知識(shí)、評(píng)估指標(biāo)、應(yīng)用場(chǎng)景、數(shù)據(jù)分析模型、數(shù)據(jù)分析小技巧、數(shù)據(jù)分析大實(shí)話以及2個(gè)綜合性的應(yīng)用案例。

作者簡(jiǎn)介

  宋天龍(TonySong) 大數(shù)據(jù)技術(shù)專(zhuān)家,觸脈咨詢合伙人兼副總裁,前Webtrekk中國(guó)區(qū)技術(shù)和咨詢負(fù)責(zé)人(Webtrekk,德國(guó)的在線數(shù)據(jù)分析服務(wù)提供商)。 擅長(zhǎng)數(shù)據(jù)挖掘、建模、分析與運(yùn)營(yíng),精通端到端數(shù)據(jù)價(jià)值場(chǎng)景設(shè)計(jì)、業(yè)務(wù)需求轉(zhuǎn)換、數(shù)據(jù)結(jié)構(gòu)梳理、數(shù)據(jù)建模與學(xué)習(xí)以及數(shù)據(jù)工程交付。在電子商務(wù)、零售、銀行、保險(xiǎn)等多個(gè)行業(yè)擁有豐富的數(shù)據(jù)項(xiàng)目工作經(jīng)驗(yàn),參與過(guò)集團(tuán)和企業(yè)級(jí)數(shù)據(jù)體系規(guī)劃、DMP與數(shù)據(jù)倉(cāng)庫(kù)建設(shè)、大數(shù)據(jù)產(chǎn)品開(kāi)發(fā)、網(wǎng)站流量系統(tǒng)建設(shè)、個(gè)性化智能推薦與精準(zhǔn)營(yíng)銷(xiāo)、企業(yè)大數(shù)據(jù)智能等。參與實(shí)施客戶案例包括聯(lián)合利華、Webpower、德國(guó)OTTO集團(tuán)電子商務(wù)(中國(guó))、Esprit中國(guó)、豬八戒網(wǎng)、順豐優(yōu)選、樂(lè)視商城、泰康人壽、酒仙網(wǎng)、國(guó)美在線、迪信通等。 著有多部暢銷(xiāo)書(shū): 《Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)》 《網(wǎng)站數(shù)據(jù)挖掘與分析:系統(tǒng)方法與商業(yè)實(shí)踐》 《企業(yè)大數(shù)據(jù)系統(tǒng)構(gòu)建實(shí)戰(zhàn):技術(shù)、架構(gòu)、實(shí)施與應(yīng)用》

圖書(shū)目錄

前言
第1章 Python和數(shù)據(jù)化運(yùn)營(yíng)1
1.1 用Python做數(shù)據(jù)化運(yùn)營(yíng)1
1.1.1 Python是什么1
1.1.2 數(shù)據(jù)化運(yùn)營(yíng)是什么2
1.1.3 Python用于數(shù)據(jù)化運(yùn)營(yíng)5
1.2 數(shù)據(jù)化運(yùn)營(yíng)所需的Python相關(guān)工具和組件5
1.2.1 Python程序6
1.2.2 Python交互環(huán)境Jupyter7
1.2.3 Python第三方庫(kù)23
1.2.4 數(shù)據(jù)庫(kù)和客戶端29
1.2.5 SSH遠(yuǎn)程客戶端30
1.3 內(nèi)容延伸:Python的OCR和tensorflow31
1.3.1 OCR工具:Tesseract-ocr31
1.3.2 機(jī)器學(xué)習(xí)框架:TensorFlow31
1.4 第1個(gè)用Python實(shí)現(xiàn)的數(shù)據(jù)化運(yùn)營(yíng)分析實(shí)例、銷(xiāo)售預(yù)測(cè)32
1.4.1 案例概述32
1.4.2 案例過(guò)程32
1.4.3 案例小結(jié)36
1.5 本章小結(jié)37
第2章 數(shù)據(jù)化運(yùn)營(yíng)的數(shù)據(jù)來(lái)源40
2.1 數(shù)據(jù)化運(yùn)營(yíng)的數(shù)據(jù)來(lái)源類(lèi)型40
2.1.1 數(shù)據(jù)文件40
2.1.2 數(shù)據(jù)庫(kù)41
2.1.3 API42
2.1.4 流式數(shù)據(jù)43
2.1.5 外部公開(kāi)數(shù)據(jù)43
2.1.6 其他來(lái)源44
2.2 使用Python獲取運(yùn)營(yíng)數(shù)據(jù)44
2.2.1 從文本文件讀取運(yùn)營(yíng)數(shù)據(jù)44
2.2.2 從Excel獲取運(yùn)營(yíng)數(shù)據(jù)55
2.2.3 從關(guān)系型數(shù)據(jù)庫(kù)MySQL讀取運(yùn)營(yíng)數(shù)據(jù)57
2.2.4 從非關(guān)系型數(shù)據(jù)庫(kù)MongoDB讀取運(yùn)營(yíng)數(shù)據(jù)64
2.2.5 從API獲取運(yùn)營(yíng)數(shù)據(jù)68
2.3 內(nèi)容延伸:讀取非結(jié)構(gòu)化網(wǎng)頁(yè)、文本、圖像、視頻、語(yǔ)音72
2.3.1 從網(wǎng)頁(yè)中獲取運(yùn)營(yíng)數(shù)據(jù)72
2.3.2 讀取非結(jié)構(gòu)化文本數(shù)據(jù)73
2.3.3 讀取圖像數(shù)據(jù)74
2.3.4 讀取視頻數(shù)據(jù)78
2.3.5 讀取語(yǔ)音數(shù)據(jù)81
2.4 本章小結(jié)85
第3章 10條數(shù)據(jù)化運(yùn)營(yíng)不得不知道的數(shù)據(jù)預(yù)處理經(jīng)驗(yàn)87
3.1 數(shù)據(jù)清洗:缺失值、異常值和重復(fù)值的處理87
3.1.1 數(shù)據(jù)列缺失的4種處理方法87
3.1.2 不要輕易拋棄異常數(shù)據(jù)89
3.1.3 數(shù)據(jù)重復(fù)就需要去重嗎90
3.1.4 代碼實(shí)操:Python數(shù)據(jù)清洗92
3.2 將分類(lèi)數(shù)據(jù)和順序數(shù)據(jù)轉(zhuǎn)換為標(biāo)志變量100
3.2.1 分類(lèi)數(shù)據(jù)和順序數(shù)據(jù)是什么100
3.2.2 運(yùn)用標(biāo)志方法處理分類(lèi)和順序變量101
3.2.3 代碼實(shí)操:Python標(biāo)志轉(zhuǎn)換101
3.3 大數(shù)據(jù)時(shí)代的數(shù)據(jù)降維104
3.3.1 需要數(shù)據(jù)降維的情況104
3.3.2 基于特征選擇的降維105
3.3.3 基于特征轉(zhuǎn)換的降維106
3.3.4 基于特征組合的降維112
3.3.5 代碼實(shí)操:Python數(shù)據(jù)降維114
3.4 解決樣本類(lèi)別分布不均衡的問(wèn)題123
3.4.1 哪些運(yùn)營(yíng)場(chǎng)景中容易出現(xiàn)樣本不均衡124
3.4.2 通過(guò)過(guò)抽樣和欠抽樣解決樣本不均衡124
3.4.3 通過(guò)正負(fù)樣本的懲罰權(quán)重解決樣本不均衡124
3.4.4 通過(guò)組合/集成方法解決樣本不均衡125
3.4.5 通過(guò)特征選擇解決樣本不均衡125
3.4.6 代碼實(shí)操:Python處理樣本不均衡125
3.5 數(shù)據(jù)化運(yùn)營(yíng)要抽樣還是全量數(shù)據(jù)128
3.5.1 什么時(shí)候需要抽樣128
3.5.2 如何進(jìn)行抽樣129
3.5.3 抽樣需要注意的幾個(gè)問(wèn)題130
3.5.4 代碼實(shí)操:Python數(shù)據(jù)抽樣131
3.6 解決運(yùn)營(yíng)數(shù)據(jù)的共線性問(wèn)題135
3.6.1 如何檢驗(yàn)共線性135
3.6.2 解決共線性的5種常用方法136
3.6.3 代碼實(shí)操:Python處理共線性問(wèn)題137
3.7 有關(guān)相關(guān)性分析的混沌139
3.7.1 相關(guān)和因果是一回事嗎139
3.7.2 相關(guān)系數(shù)低就是不相關(guān)嗎139
3.7.3 代碼實(shí)操:Python相關(guān)性分析140
3.8 標(biāo)準(zhǔn)化,讓運(yùn)營(yíng)數(shù)據(jù)落入相同的范圍141
3.8.1 實(shí)現(xiàn)中心化和正態(tài)分布的Z-Score141
3.8.2 實(shí)現(xiàn)歸一化的Max-Min142
3.8.3 用于稀疏數(shù)據(jù)的MaxAbs142
3.8.4 針對(duì)離群點(diǎn)的RobustScaler142
3.8.5 代碼實(shí)操:Python數(shù)據(jù)標(biāo)準(zhǔn)化處理142
3.9 離散化,對(duì)運(yùn)營(yíng)數(shù)據(jù)做邏輯分層145
3.9.1 針對(duì)時(shí)間數(shù)據(jù)的離散化145
3.9.2 針對(duì)多值離散數(shù)據(jù)的離散化146
3.9.3 針對(duì)連續(xù)數(shù)據(jù)的離散化146
3.9.4 針對(duì)連續(xù)數(shù)據(jù)的二值化147
3.9.5 代碼實(shí)操:Python數(shù)據(jù)離散化處理147
3.10 內(nèi)容延伸:非結(jié)構(gòu)化數(shù)據(jù)的預(yù)處理151
3.10.1 網(wǎng)頁(yè)數(shù)據(jù)解析151
3.10.2 網(wǎng)絡(luò)用戶日志解析159
3.10.3 圖像的基本預(yù)處理164
3.10.4 自然語(yǔ)言文本預(yù)處理169
3.11 本章小結(jié)172
第4章 跳過(guò)運(yùn)營(yíng)數(shù)據(jù)分析和挖掘的“大坑”174
4.1 聚類(lèi)分析174
4.1.1 當(dāng)心數(shù)據(jù)異常對(duì)聚類(lèi)結(jié)果的影響175
4.1.2 超大數(shù)據(jù)量時(shí)應(yīng)該放棄K均值算法175
4.1.3 聚類(lèi)不僅是建模的終點(diǎn),更是重要的中間預(yù)處理過(guò)程177
4.1.4 高維數(shù)據(jù)上無(wú)法應(yīng)用聚類(lèi)嗎178
4.1.5 如何選擇聚類(lèi)分析算法179
4.1.6 案例:客戶特征的聚類(lèi)與探索性分析179
4.2 回歸分析196
4.2.1 注意回歸自變量之間的共線性問(wèn)題197
4.2.2 相關(guān)系數(shù)、判定系數(shù)和回歸系數(shù)之間是什么關(guān)系197
4.2.3 判定系數(shù)是否意味著相應(yīng)的因果聯(lián)系197
4.2.4 注意應(yīng)用回歸模型時(shí)研究自變量是否產(chǎn)生變化198
4.2.5 如何選擇回歸分析算法198
4.2.6 案例:大型促銷(xiāo)活動(dòng)前的銷(xiāo)售預(yù)測(cè)199
4.3 分類(lèi)分析206
4.3.1 防止分類(lèi)模型的過(guò)擬合問(wèn)題207
4.3.2 使用關(guān)聯(lián)算法做分類(lèi)分析207
4.3.3 用分類(lèi)分析來(lái)提煉規(guī)則、提取變量、處理缺失值208
4.3.4 類(lèi)別劃分:分類(lèi)算法和聚類(lèi)算法都是好手209
4.3.5 如何選擇分類(lèi)分析算法210
4.3.6 案例:用戶流失預(yù)測(cè)分析與應(yīng)用210
4.4 關(guān)聯(lián)分析221
4.4.1 頻繁規(guī)則不一定是有效規(guī)則221
4.4.2 不要被啤酒尿布的故事禁錮你的思維222
4.4.3 被忽略的“負(fù)相關(guān)”模式真的毫無(wú)用武之地嗎223
4.4.4 頻繁規(guī)則只能打包組合應(yīng)用嗎2

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.shuitoufair.cn 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)