
內容簡介
本書以業務為導向,詳細地講解了如何通過大數據分析來解決商業問題。其目的在於運用大數據分析思維,幫助讀者把學術知識應用於真實的業務場景,解決實際的業務問題。 本書基於業務問題,就如何搭建分析框架,厘清分析思路,按照標準分析步驟對數據進行恰當的預處理,選擇合適的分析方法和分析模型,使用恰當的分析工具對數據進行分析,以及對分析結果進行可視化和符合業務要求的解讀等內容展開講解,幫助業務專家做出合適的業務判斷,製定準確的業務策略。 本書既可作為各行各業的一線業務在線人員、業務決策人員、數據分析人員、企業管理人員的學習用書,也可以作為廣大本科院校、高職高專院校的大數據相關專業的教材用書,還可作為從事大數據分析與應用培訓的參考教材。
作者簡介
傅一航,大數據培訓講師。計算機軟件與理論碩士(研究方向:數據挖掘、搜索引擎)。在華為工作十年,獲得多個獎項及五項國家專利,對大數據技術有深入實踐和研究!
專注於大數據分析、數據挖掘、數據建模、機器學習等應用技術,以及大數據係統部署解決方案,旨在將大數據技術應用於商業領域,幫助決策者實現管理決策、運營決策、營銷決策!
目錄
第I部分數據決策理論篇
第1章從0到1解構大數據002
1.1數字化背景.002
1.2大數據的三層認知003
1.3什麼是大數據005
1.4大數據十字特征.006
1.5DIKW體係009
1.6數據的本質.010
1.7大數據不在於大,而在於全.011
本章小結013
第2章數據決策的底層邏輯014
2.1數據的決策邏輯.014
2.2探索規律,按照規律來決策.015
2.3發現變化,找到短板來決策.017
2.4厘清關係,找影響因素做決策020
2.5預測未來,通過預判來決策.022
本章小結024
第3章數據決策環節025
3.1數據決策路徑.025
3.2業務數據化.026
3.3數據信息化.027
3.4信息策略化.028
3.5案例:賺差價的營業員028
本章小結030
第Ⅱ部分
數據分析基礎篇
第4章數據分析概述032
4.1認識業務分析階段032
4.1.1現狀分析.033
4.1.2原因分析.033
4.1.3預測分析.033
4.2了解數據分析方法034
4.2.1描述性分析.034
4.2.2診斷性分析.034
4.2.3預測性分析.035
4.2.4推斷性分析.035
4.2.5專題性分析.035
4.3熟知數據分析過程035
4.3.1第1步:明確目的036
4.3.2第2步:收集數據038
4.3.3第3步:整理數據039
4.3.4第4步:分析數據040
4.3.5第5步:呈現數據043
4.3.6第6步:形成結論044
本章小結045
第5章數據分析框架046
5.1數據分析思路.046
5.2精準營銷分析框架(6R準則)047
5.2.1正確的客戶.048
5.2.2正確的產品.049
5.2.3合理的價格.049
5.2.4最佳的時機.050
5.2.5合適的方式.050
5.2.6恰當的信息.051
5.2.7喜愛的套餐.051
5.3精準營銷分析過程052
5.4用戶行為分析框架(5W2H)055
5.4.1WHY.056
5.4.2WHAT056
5.4.3WHO.056
5.4.4WHEN056
5.4.5WHERE.057
5.4.6HOW.057
5.4.7HOWMUCH.057
5.5零售行業指標體係.058
5.5.1人(銷售員、消費者)058
5.5.2貨(商品).059
5.5.3場(店鋪).059
本章小結060
第6章數據預處理061
6.1預處理任務.061
6.2數據集成.062
6.2.1樣本追加.063
6.2.2變量合並.063
6.2.3連接示例.067
6.3數據清洗.068
6.3.1重複值處理.068
6.3.2錯誤值處理.069
6.3.3離群值處理.070
6.3.4缺失值處理.074
6.4樣本處理.076
6.4.1數據篩選.076
6.4.2隨機抽樣.076
6.4.3數據平衡.077
6.5變量處理.078
6.6質量評估.079
本章小結080
第Ⅲ部分
描述統計分析篇
第7章數據統計分析基礎082
7.1認識數據集.082
7.1.1數據集格式.082
7.1.2數據存儲類型.083
7.1.3數據統計類型.084
7.2統計分析基礎.085
7.2.1操作模式.085
7.2.2關鍵要素.086
7.2.3三個操作步驟.087
7.2.4透視表組成結構088
7.3常用統計指標.089
7.3.1集中趨勢.090
7.3.2離散程度.092
7.3.3分布形態.094
7.3.4統計匯總函數.096
本章小結097
第8章數據統計分析方法098
8.1對比分析法.098
8.1.1案例:用戶特征分析099
8.1.2案例:增量不增收100
8.1.3統計分析思路框架102
8.2結構分析法.103
8.2.1案例:靜態結構分析104
8.2.2案例:動態結構分析104
8.2.3案例:財務結構分析105
8.3分布分析法.106
8.3.1案例:運營商用戶消費分布.107
8.3.2案例:銀行用戶消費分析.107
8.3.3案例:運營商流量分布109
8.4趨勢分析法.110
8.4.1案例:手機銷量淡旺季110
8.4.2案例:訂單需求的周期性.111
8.4.3案例:破解零售店的銷售規律.112
8.5交叉分析法.113
8.5.1案例:各區域產品銷量113
8.5.2案例:產品偏好分析114
8.5.3案例:違約影響因素分析.117
8.6杜邦分析法.120
8.6.1案例:淨資產收益率分析.121
8.6.2案例:市場占有率分析121
8.6.3案例:銷售策略分析122
8.7漏鬥分析法.122
8.7.1案例:電商轉化率分析123
8.7.2案例:消費者行為分析模型.125
本章小結126
第9章數據的可視化分析127
9.1繪圖基本原則.127
9.2柱形圖.128
9.2.1簡單柱形圖.128
9.2.2複式柱形圖.129
9.2.3堆積柱形圖.129
9.2.4百分比堆積柱形圖130
9.2.5畫圖原則.131
9.3直方圖.131
9.3.1分布形態.132
9.3.2溢出值考慮.133
9.3.3多組直方圖.134
9.3.4畫圖原則.134
9.4箱形圖.135
9.4.1簡單箱形圖.135
9.4.2分組箱形圖.136
9.4.3畫圖原則.137
9.5餅圖137
9.5.1簡單餅圖.137
9.5.2複合餅圖.138
9.5.3畫圖原則.138
9.6瀑布圖.139
9.6.1結構瀑布圖.139
9.6.2變化瀑布圖.140
9.6.3畫圖原則.141
9.7折線圖.141
9.7.1簡單折線圖.141
9.7.2多折線圖.141
9.7.3畫圖原則.142
9.8散點圖/氣泡圖142
9.8.1散點圖142
9.8.2氣泡圖143
9.8.3畫圖原則.143
9.9漏鬥圖.144
9.9.1漏鬥圖介紹.144
9.9.2畫圖原則.144
9.10象限圖.144
9.10.1象限圖介紹.145
9.10.2畫圖原則.145
9.11帕累托圖.145
9.11.1帕累托圖介紹.145
9.11.2畫圖原則.146
本章小結146
第Ⅳ部分
影響因素分析篇
第10章相關分析148
10.1影響因素分析.148
10.2相關分析.150
10.2.1相關分析種類151
10.2.2散點圖.151
10.2.3相關係數.153
10.2.4顯著性檢驗.154
10.3簡單相關分析步驟155
10.3.1第1步:繪製散點圖156
10.3.2第2步:計算相關係數.157
10.3.3第3步:顯著性檢驗158
10.3.4第4步:進行業務判斷.158
10.4三種相關係數.158
10.4.1Pearson相關係數.159
10.4.2Spearman相關係數.160
10.4.3Kendall相關係數.161
10.5相關係數的選擇.164
10.6案例:消費水平影響因素分析165
10.7偏相關分析.167
10.7.1偏相關概念.168
10.7.2計算公式.168
10.7.3顯著性檢驗.168
10.7.4案例:消費水平的偏相關分析.169
本章小結170
第11章方差分析171
11.1方差分析的基本知識.171
11.1.1基本原理.172
11.1.2方差分析前提條件178
11.2方差分析類別.179
11.3單因素方差分析.179
11.3.1單因素方差分析步驟179
11.3.2案例:單因素方差分析應用.180
11.4多因素方差分析.183
11.4.1基本原理.183
11.4.2案例:營銷廣告策略分析.186
11.4.3案例:消費水平的影響因素分析189
11.5協方差分析.193
11.5.1基本原理.193
11.5.2案例:生豬飼料效果差異性評估194
11.5.3案例:消費水平的影響因素分析195
本章小結197
第12章列聯分析198
12.1列聯分析的基本知識.198
12.1.1列聯表.199
12.1.2期望值.199
12.2卡方檢驗.200
12.3列聯分析步驟.201
12.4案例:客戶流失的影響因素分析201
本章小結205
第Ⅴ部分
統計推斷分析篇
第13章概率論基礎207
13.1基本概念.207
13.2概率分布.209
13.3離散型概率分布.210
13.3.1概率分布表示210
13.3.2伯努利分布.212
13.3.3二項分布.212
13.3.4泊鬆分布.216
13.3.5幾何分布.219
13.4連續型概率分布.221
13.4.1概率分布表示221
13.4.2均勻分布.225
13.4.3指數分布.226
13.4.4正態分布.229
13.5其他常用分布.233
13.5.1χ2分布.233
13.5.2F分布236
13.5.3T分布238
13.6隨機變量的數字特征.239
13.6.1數學期望.240
13.6.2方差240
本章小結241
第14章參數估計243
14.1抽樣估計基礎.243
14.1.1基本概念.243
14.1.2抽樣方法.244
14.1.3大數定律.246
14.1.4中心極限定理247
14.2參數估計.250
14.2.1點估計.250
14.2.2均值點估計.252
14.2.3比例點估計.253
14.2.4產品壽命估計254
14.3區間估計.255
14.3.1基本概念.255
14.3.2均值區間估計256
14.3.3方差區間估計260
14.3.4比例區間估計263
14.4抽樣誤差.265
14.5樣本容量確定.266
14.5.1均值評估的樣本容量266
14.5.2比例評估的樣本容量267
本章小結268
第15章假設檢驗269
15.1基本思想.269
15.1.1反證法.270
15.1.2小概率.270
15.2檢驗種類.270
15.3基本步驟.271
15.4顯著性檢驗.274
15.5常用檢驗統計量.277
15.5.1均值檢驗.277
15.5.2方差檢驗.283
15.5.3比例檢驗.286
15.6兩類錯誤.287
15.7案例:SPSS中假設檢驗.288
15.7.1案例:周歲兒童身高T檢驗.288
15.7.2案例:信用卡消費水平T檢驗289
本章小結291
第16章雙樣本假設檢驗292
16.1兩獨立樣本檢驗.292
16.1.1均值差異檢驗293
16.1.2方差齊性檢驗296
16.2兩配對樣本檢驗.297
16.2.1案例:存活天數差異298
16.2.2案例:施肥對幼苗成長影響.299
16.2.3案例:針織品斷裂強力差異檢驗300
16.3案例:Excel中雙樣本檢驗301
16.3.1案例:供應商交付周期差異評估301
16.3.2案例:農作物產量差異分析.303
16.3.3案例:樁長度的估計值與
實際值的差異評估305
16.4案例:SPSS中雙樣本檢驗.306
16.4.1案例:促銷與非促銷效果差異檢驗.306
16.4.2案例:煙齡和膽固醇關係檢驗308
16.4.3案例:減肥茶效果檢驗.309
本章小結310
參考文獻311
······
最後修改:2024 年 12 月 19 日
© 允許規範轉載
