IBM SPPS Statistics是一個(gè)專業(yè)的數(shù)據(jù)挖掘工具,其中內(nèi)置了大量的數(shù)據(jù)分析常用方法、模型。專業(yè)人員和非專業(yè)人員都適用,不需要懂太多的挖掘算法和模型,專業(yè)人員也可以用來作深入的數(shù)據(jù)分析與數(shù)據(jù)挖掘。
第一部分:數(shù)據(jù)集基礎(chǔ)知識(了解你的數(shù)據(jù)集)
1、數(shù)據(jù)集概述
2、數(shù)據(jù)集的類型
3、數(shù)據(jù)集屬性的類型
? 標(biāo)稱
? 序數(shù)
? 度量
4、數(shù)據(jù)質(zhì)量三要素
? 準(zhǔn)確性
? 完整性
? 一致性
5、數(shù)據(jù)預(yù)處理的內(nèi)容
? 數(shù)據(jù)清理(缺失值、離群值的處理方法)
? 數(shù)據(jù)歸約(維災(zāi)難、維歸約、主成分分析)
? 特征子集選擇
? 特征創(chuàng)建/屬性構(gòu)造
? 數(shù)據(jù)離散化和二元化
? 屬性/變量轉(zhuǎn)換
6、數(shù)據(jù)探索性分析
? 統(tǒng)計(jì)匯總
? 可視化
演練:描述性分析(頻數(shù)、描述、探索、分類匯總)
第二部分:數(shù)據(jù)挖掘基礎(chǔ)知識(基礎(chǔ),決定你的高度)
1、數(shù)據(jù)統(tǒng)計(jì)分析軟件簡介
? EXCEL表格處理與數(shù)據(jù)分析工具庫
? SAS統(tǒng)計(jì)分析系統(tǒng)
? SPSS統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案
2、數(shù)據(jù)挖掘概述
案例:宜家IKE如何通過數(shù)據(jù)挖掘來降低營銷成本提升利潤?
3、數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程(CRISP-DM)
? 商業(yè)理解
? 數(shù)據(jù)準(zhǔn)備
? 數(shù)據(jù)理解
? 模型建立
? 模型評估
? 模型應(yīng)用
案例:客戶匹配度建模—找到你的準(zhǔn)客戶
案例:4G終端營銷項(xiàng)目挖掘過程分析
4、常用數(shù)據(jù)統(tǒng)計(jì)指標(biāo)
? 集中程度:均值、中位數(shù)、眾數(shù)
? 離開程度:方差、標(biāo)準(zhǔn)差、極差
? 分布趨勢:偏度、峰度
? 理解分布:正態(tài)分布、T分布、F分布
5、SPSS基本操作(預(yù)處理)
? 數(shù)據(jù)導(dǎo)入
? 數(shù)據(jù)排序(排序個(gè)案)
? 重復(fù)數(shù)據(jù)處理(標(biāo)識重復(fù)個(gè)案)
? 缺失值處理(替換缺失值)
? 生成新變量(計(jì)算變量、重新編碼)
? 數(shù)據(jù)分組(分類匯總)
? 數(shù)據(jù)合并(合并文件)
6、數(shù)據(jù)描述性統(tǒng)計(jì)
? 連續(xù)變量統(tǒng)計(jì)描述
? 分類變量統(tǒng)計(jì)描述
第三部分:數(shù)據(jù)挖掘?qū)崙?zhàn)篇
1、參數(shù)檢驗(yàn)分析(樣本均值檢驗(yàn))
問題:如何驗(yàn)證營銷效果的有效性?
? 假設(shè)檢驗(yàn)概述
2 單樣本T檢驗(yàn)
2 兩獨(dú)立樣本T檢驗(yàn)
2 兩配對樣本T檢驗(yàn)
? 假設(shè)檢驗(yàn)適用場景
案例:電信運(yùn)營商ARPU值評估分析(單樣本)
案例:營銷活動前后分析(兩配對樣本)
案例:信用卡消費(fèi)金額評估分析(單樣本)
案例:吸煙與膽固醇升高的分析(兩獨(dú)立樣本)
案例:減肥效果評估(兩配對樣本)
2、非參數(shù)檢驗(yàn)分析(樣本分布檢驗(yàn))
問題:這些屬性數(shù)據(jù)的分布情況如何?如何從數(shù)據(jù)分布中看出問題?
? 非參數(shù)檢驗(yàn)概述
2 單樣本檢驗(yàn)
2 兩獨(dú)立樣本檢驗(yàn)
2 兩相關(guān)樣本檢驗(yàn)
2 兩配對樣本檢驗(yàn)
? 非參數(shù)檢驗(yàn)適用場景
案例:產(chǎn)品合格率檢驗(yàn)(單樣本-二項(xiàng)分布)
案例:訓(xùn)練新方法有效性檢驗(yàn)(兩配對樣本-符號/秩檢驗(yàn))
案例:促銷方式效果檢驗(yàn)(多相關(guān)樣本-Friedman檢驗(yàn))
案例:客戶滿意度差異檢驗(yàn)(多相關(guān)樣本-Cochran Q檢驗(yàn))
3、相關(guān)分析(相關(guān)程度計(jì)算)
問題:這兩個(gè)屬性是否會相互影響?影響程度大嗎?
? 相關(guān)分析概述
案例:家庭生活開支的相關(guān)分析
案例:營銷費(fèi)用與銷售額的相關(guān)分析
案例:哪些因素與汽車銷量有相關(guān)性
4、方差分析(影響因素分析)
問題:哪些才是影響銷量的關(guān)鍵因素?
? 方差分析原理
? 方差分析的步驟
? 方差分析適用場景
案例:陳列位置對終端銷量的影響分析(單因素)
案例:廣告形式、地區(qū)對銷量的影響因素分析(多因素)
案例:2015年大學(xué)生工資與父母職業(yè)的關(guān)系
5、回歸分析(預(yù)測分析)
問題:如何預(yù)測未來的銷售量(定量分析)?
? 回歸分析概述及適用場景
? 回歸分析的檢驗(yàn)過程
? 如何選擇最優(yōu)回歸模型
? 解讀回歸分析結(jié)果
案例:推廣費(fèi)用、辦公費(fèi)用與銷售額的關(guān)系(線性回歸)
案例:人均現(xiàn)金消費(fèi)支出對人均食品消費(fèi)支出的影響(曲線回歸)
? 帶分類變量的回歸分析
? 如何預(yù)測隨著季節(jié)性變化的銷量情況
案例:員工工齡、性別與終端銷售的關(guān)系分析
案例:產(chǎn)品銷量的季節(jié)性變化預(yù)測
6、邏輯回歸分析
問題:如果評估用戶是否購買產(chǎn)品的概率?
? 邏輯回歸分析
? 邏輯回歸的原理
案例:客戶購買預(yù)測分析(二元邏輯回歸)
案例:品牌選擇預(yù)測分析(多項(xiàng)邏輯回歸)
7、時(shí)間序列分析(預(yù)測分析)
問題:隨著時(shí)間變化,未來的銷量變化趨勢如何?
? 時(shí)序分析概述
2 移動平均MA模型
2 指數(shù)平滑ES模型
2 自回歸滑動平均ARIMA模型
2 季節(jié)分解模型
? 時(shí)序分析適用場景
案例:汽車銷量預(yù)測分析(指數(shù)平滑)
案例:上交所指數(shù)收益率預(yù)測分析(ARIMA)
案例:服裝銷售數(shù)據(jù)季節(jié)性趨勢預(yù)測分析(季節(jié)分解)
第四部分:高級數(shù)據(jù)挖掘方法
1、聚類分析(Clustering)
問題:我們的客戶有幾類?各類特征是什么?
? 聚類方法原理介紹
? 聚類方法適用場景
? 系統(tǒng)聚類(層次聚類)
案例:小康指數(shù)劃分(Q型聚類)
案例:裁判標(biāo)準(zhǔn)一致性分析(R型聚類)
? K均值聚類(快速聚類)
案例:移動三大品牌細(xì)分市場合適嗎?
案例:如何評選優(yōu)秀員工(固定聚類中心)
演練:如何選擇新產(chǎn)品試銷地點(diǎn)?
2、決策樹分類分析(Classification)
問題:這類客戶有什么特征?有什么潛在銷售機(jī)會?
? 決策樹原理介紹
? 分類適用場景
案例:銀行低信用客戶特征分析(決策樹分類)
3、關(guān)聯(lián)分析(Association)
問題:購買A產(chǎn)品的顧客還常常要購買其他什么產(chǎn)品?
? 關(guān)聯(lián)規(guī)則原理介紹
? 關(guān)聯(lián)規(guī)則適用場景
案例:超市商品交叉銷售與布局優(yōu)化(關(guān)聯(lián)分析)
4、客戶價(jià)值評估RFM模型
問題:如何評估客戶的價(jià)值?不同價(jià)值客戶的營銷策略有什么區(qū)別?
? RFM模型介紹
? RFM模型適用場景
? RFM與客戶活躍度分析
案例:客戶用戶價(jià)值評估(RFM分析)
案例:重購用戶特征分析(決策樹分析)
第五部分:統(tǒng)計(jì)圖表篇(看圖說話)
1、柱狀圖/線圖/餅圖/高低圖/箱圖/散點(diǎn)圖/直方圖
2、圖形的表達(dá)及適用場景
案例:各種圖形繪制
第六部分:實(shí)戰(zhàn)-數(shù)據(jù)挖掘項(xiàng)目
實(shí)戰(zhàn)1:客戶流失預(yù)警與客戶挽留之真實(shí)數(shù)據(jù)分析實(shí)踐
實(shí)戰(zhàn)2:銀行信用風(fēng)險(xiǎn)分析
結(jié)束:課程總結(jié)與問題答疑。