IBM SPPS Statistics是一個專業(yè)的數據挖掘工具,其中內置了大量的數據分析常用方法、模型。專業(yè)人員和非專業(yè)人員都適用,不需要懂太多的挖掘算法和模型,專業(yè)人員也可以用來作深入的數據分析與數據挖掘。
第一部分:數據集基礎知識(了解你的數據集)
1、數據集概述
2、數據集的類型
3、數據集屬性的類型
? 標稱
? 序數
? 度量
4、數據質量三要素
? 準確性
? 完整性
? 一致性
5、數據預處理的內容
? 數據清理(缺失值、離群值的處理方法)
? 數據歸約(維災難、維歸約、主成分分析)
? 特征子集選擇
? 特征創(chuàng)建/屬性構造
? 數據離散化和二元化
? 屬性/變量轉換
6、數據探索性分析
? 統計匯總
? 可視化
演練:描述性分析(頻數、描述、探索、分類匯總)
第二部分:數據挖掘基礎知識(基礎,決定你的高度)
1、數據統計分析軟件簡介
? EXCEL表格處理與數據分析工具庫
? SAS統計分析系統
? SPSS統計產品與服務解決方案
2、數據挖掘概述
案例:宜家IKE如何通過數據挖掘來降低營銷成本提升利潤?
3、數據挖掘的標準流程(CRISP-DM)
? 商業(yè)理解
? 數據準備
? 數據理解
? 模型建立
? 模型評估
? 模型應用
案例:客戶匹配度建?!业侥愕臏士蛻?/strong>
案例:4G終端營銷項目挖掘過程分析
4、常用數據統計指標
? 集中程度:均值、中位數、眾數
? 離開程度:方差、標準差、極差
? 分布趨勢:偏度、峰度
? 理解分布:正態(tài)分布、T分布、F分布
5、SPSS基本操作(預處理)
? 數據導入
? 數據排序(排序個案)
? 重復數據處理(標識重復個案)
? 缺失值處理(替換缺失值)
? 生成新變量(計算變量、重新編碼)
? 數據分組(分類匯總)
? 數據合并(合并文件)
6、數據描述性統計
? 連續(xù)變量統計描述
? 分類變量統計描述
第三部分:數據挖掘實戰(zhàn)篇
1、參數檢驗分析(樣本均值檢驗)
問題:如何驗證營銷效果的有效性?
? 假設檢驗概述
2 單樣本T檢驗
2 兩獨立樣本T檢驗
2 兩配對樣本T檢驗
? 假設檢驗適用場景
案例:電信運營商ARPU值評估分析(單樣本)
案例:營銷活動前后分析(兩配對樣本)
案例:信用卡消費金額評估分析(單樣本)
案例:吸煙與膽固醇升高的分析(兩獨立樣本)
案例:減肥效果評估(兩配對樣本)
2、非參數檢驗分析(樣本分布檢驗)
問題:這些屬性數據的分布情況如何?如何從數據分布中看出問題?
? 非參數檢驗概述
2 單樣本檢驗
2 兩獨立樣本檢驗
2 兩相關樣本檢驗
2 兩配對樣本檢驗
? 非參數檢驗適用場景
案例:產品合格率檢驗(單樣本-二項分布)
案例:訓練新方法有效性檢驗(兩配對樣本-符號/秩檢驗)
案例:促銷方式效果檢驗(多相關樣本-Friedman檢驗)
案例:客戶滿意度差異檢驗(多相關樣本-Cochran Q檢驗)
3、相關分析(相關程度計算)
問題:這兩個屬性是否會相互影響?影響程度大嗎?
? 相關分析概述
案例:家庭生活開支的相關分析
案例:營銷費用與銷售額的相關分析
案例:哪些因素與汽車銷量有相關性
4、方差分析(影響因素分析)
問題:哪些才是影響銷量的關鍵因素?
? 方差分析原理
? 方差分析的步驟
? 方差分析適用場景
案例:陳列位置對終端銷量的影響分析(單因素)
案例:廣告形式、地區(qū)對銷量的影響因素分析(多因素)
案例:2015年大學生工資與父母職業(yè)的關系
5、回歸分析(預測分析)
問題:如何預測未來的銷售量(定量分析)?
? 回歸分析概述及適用場景
? 回歸分析的檢驗過程
? 如何選擇最優(yōu)回歸模型
? 解讀回歸分析結果
案例:推廣費用、辦公費用與銷售額的關系(線性回歸)
案例:人均現金消費支出對人均食品消費支出的影響(曲線回歸)
? 帶分類變量的回歸分析
? 如何預測隨著季節(jié)性變化的銷量情況
案例:員工工齡、性別與終端銷售的關系分析
案例:產品銷量的季節(jié)性變化預測
6、邏輯回歸分析
問題:如果評估用戶是否購買產品的概率?
? 邏輯回歸分析
? 邏輯回歸的原理
案例:客戶購買預測分析(二元邏輯回歸)
案例:品牌選擇預測分析(多項邏輯回歸)
7、時間序列分析(預測分析)
問題:隨著時間變化,未來的銷量變化趨勢如何?
? 時序分析概述
2 移動平均MA模型
2 指數平滑ES模型
2 自回歸滑動平均ARIMA模型
2 季節(jié)分解模型
? 時序分析適用場景
案例:汽車銷量預測分析(指數平滑)
案例:上交所指數收益率預測分析(ARIMA)
案例:服裝銷售數據季節(jié)性趨勢預測分析(季節(jié)分解)
第四部分:高級數據挖掘方法
1、聚類分析(Clustering)
問題:我們的客戶有幾類?各類特征是什么?
? 聚類方法原理介紹
? 聚類方法適用場景
? 系統聚類(層次聚類)
案例:小康指數劃分(Q型聚類)
案例:裁判標準一致性分析(R型聚類)
? K均值聚類(快速聚類)
案例:移動三大品牌細分市場合適嗎?
案例:如何評選優(yōu)秀員工(固定聚類中心)
演練:如何選擇新產品試銷地點?
2、決策樹分類分析(Classification)
問題:這類客戶有什么特征?有什么潛在銷售機會?
? 決策樹原理介紹
? 分類適用場景
案例:銀行低信用客戶特征分析(決策樹分類)
3、關聯分析(Association)
問題:購買A產品的顧客還常常要購買其他什么產品?
? 關聯規(guī)則原理介紹
? 關聯規(guī)則適用場景
案例:超市商品交叉銷售與布局優(yōu)化(關聯分析)
4、客戶價值評估RFM模型
問題:如何評估客戶的價值?不同價值客戶的營銷策略有什么區(qū)別?
? RFM模型介紹
? RFM模型適用場景
? RFM與客戶活躍度分析
案例:客戶用戶價值評估(RFM分析)
案例:重購用戶特征分析(決策樹分析)
第五部分:統計圖表篇(看圖說話)
1、柱狀圖/線圖/餅圖/高低圖/箱圖/散點圖/直方圖
2、圖形的表達及適用場景
案例:各種圖形繪制
第六部分:實戰(zhàn)-數據挖掘項目
實戰(zhàn)1:客戶流失預警與客戶挽留之真實數據分析實踐
實戰(zhàn)2:銀行信用風險分析
結束:課程總結與問題答疑。