傅一航,傅一航講師,傅一航聯(lián)系方式,傅一航培訓(xùn)師-【中華講師網(wǎng)】
大數(shù)據(jù) 數(shù)據(jù)分析 數(shù)據(jù)挖掘 數(shù)據(jù)建模
52
鮮花排名
0
鮮花數(shù)量
傅一航:大數(shù)據(jù)挖掘語(yǔ)言:用Python實(shí)現(xiàn)大數(shù)據(jù)挖掘項(xiàng)目實(shí)戰(zhàn)培訓(xùn)
2017-03-22 3287
對(duì)象
大數(shù)據(jù)系統(tǒng)開發(fā)部、大數(shù)據(jù)分析中心、業(yè)務(wù)支撐部、IT系統(tǒng)部等相關(guān)技術(shù)人員。
目的
掌握Python語(yǔ)言,以及在數(shù)據(jù)挖掘中的應(yīng)用
內(nèi)容

Python是一門解釋性語(yǔ)言,僅次于JAVA/C/C++/C#最受歡迎的語(yǔ)言,可應(yīng)用在大數(shù)據(jù)語(yǔ)言。易學(xué),易懂,功能強(qiáng)大。其中有著大量的擴(kuò)展庫(kù)來(lái)實(shí)現(xiàn)數(shù)據(jù)分析與數(shù)據(jù)挖掘功能。


第一部分:Python語(yǔ)言基礎(chǔ)

目的:掌握基本的Python編程思想與編程語(yǔ)句,熟悉常用數(shù)據(jù)結(jié)構(gòu)的操作

1、Python簡(jiǎn)介

2、開發(fā)環(huán)境搭建

? ?Python的安裝

? ?擴(kuò)展庫(kù)的安裝

3、掌握Python的簡(jiǎn)單數(shù)據(jù)類型

? ? 字符串的使用及操作

? ?整數(shù)、浮點(diǎn)數(shù)

4、掌握基本語(yǔ)句:

? ?if、while、for、print等

? ?基本運(yùn)算:

? ?函數(shù)定義、參數(shù)傳遞、返回值

5、掌握復(fù)雜的數(shù)據(jù)類型:列表/元組

? ?列表操作:訪問(wèn)、添加、修改、刪除、排序

? ?列表切片、復(fù)制等

? ?列表相關(guān)的函數(shù)、方法

? ?元組的應(yīng)用

6、復(fù)雜數(shù)據(jù)類型:字典

? ?創(chuàng)建、訪問(wèn)、修改、刪除、遍歷

? ?字典函數(shù)和方法

7、復(fù)雜數(shù)據(jù)類型:集合

8、掌握面向?qū)ο缶幊趟枷?

? ?創(chuàng)建類、繼承類

? ?模塊

9、函數(shù)定義、參數(shù)傳遞、返回值

10、 ? ?標(biāo)準(zhǔn)庫(kù)與擴(kuò)展庫(kù)的導(dǎo)入

11、 ? ?異常處理:try-except塊

演練:基本的Python編程語(yǔ)句


第二部分:Python語(yǔ)言與數(shù)據(jù)挖掘庫(kù)

目的:掌握數(shù)據(jù)集結(jié)構(gòu)及基本處理方法,進(jìn)一步鞏固Python語(yǔ)言

1、數(shù)據(jù)挖掘常用擴(kuò)展庫(kù)介紹

? ?Numpy數(shù)組處理支持

? ?Scipy矩陣計(jì)算模塊

? ?Matplotlib數(shù)據(jù)可視化工具庫(kù)

? ?Pandas數(shù)據(jù)分析和探索工具

? ?StatsModels統(tǒng)計(jì)建模庫(kù)

? ?Scikit-Learn機(jī)器學(xué)習(xí)庫(kù)

? ?Keras深度學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))庫(kù)

? ?Gensim文本挖掘庫(kù)

2、數(shù)據(jù)集讀取與操作:讀取、寫入

? ?讀寫文本文件

? ?讀寫CSV文件

? ?讀寫Excel文件

? ?從數(shù)據(jù)庫(kù)獲取數(shù)據(jù)集

3、數(shù)據(jù)集的核心數(shù)據(jù)結(jié)構(gòu)(Pandas數(shù)據(jù)結(jié)構(gòu))

? ?DataFrame對(duì)象及處理方法

? ?Series對(duì)象及處理方法

演練:用Python實(shí)現(xiàn)數(shù)據(jù)的基本統(tǒng)計(jì)分析功能


第三部分:數(shù)據(jù)可視化處理

目的:掌握作圖擴(kuò)展庫(kù),實(shí)現(xiàn)數(shù)據(jù)可視化

1、常用的Python作圖庫(kù)

? ?Matplotlib庫(kù)

? ?Pygal庫(kù)

2、實(shí)現(xiàn)分類匯總

演練:按性別統(tǒng)計(jì)用戶人數(shù)

演練:按產(chǎn)品+日期統(tǒng)計(jì)各產(chǎn)品銷售金額


3、各種圖形的畫法

? ?直方圖

? ?餅圖

? ?折線圖

? ?散點(diǎn)圖

4、繪圖的美化技巧

演練:用Python庫(kù)作圖來(lái)實(shí)現(xiàn)產(chǎn)品銷量分析,并可視化


第四部分:數(shù)據(jù)挖掘基礎(chǔ)

目的:掌握數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程

1、數(shù)據(jù)挖掘概述

2、數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程(CRISP-DM)

? ?商業(yè)理解

? ?數(shù)據(jù)準(zhǔn)備

? ?數(shù)據(jù)理解

? ?模型建立

? ?模型評(píng)估

? ?模型應(yīng)用

3、數(shù)據(jù)挖掘常用任務(wù)與算法

案例:用大數(shù)據(jù)實(shí)現(xiàn)精準(zhǔn)營(yíng)銷的項(xiàng)目過(guò)程


第五部分:數(shù)據(jù)理解和數(shù)據(jù)準(zhǔn)備

目的:掌握數(shù)據(jù)預(yù)處理的基本環(huán)節(jié),以及Python的實(shí)現(xiàn)

1、數(shù)據(jù)預(yù)處理

? ?異常值處理:3σ準(zhǔn)則,IQR準(zhǔn)則

? ?缺失值插補(bǔ):均值、拉格朗日插補(bǔ)

? ?數(shù)據(jù)篩選/抽樣

? ?數(shù)據(jù)的離散化處理

? ?變量變換、變量派生

2、數(shù)據(jù)的基本分析

? ?相關(guān)分析:原理、公式、應(yīng)用

? ?方差分析:原理、公式、應(yīng)用

? ?卡方分析:原理、公式、應(yīng)用

? ?主成分分析:降維

案例:用Python實(shí)現(xiàn)數(shù)據(jù)預(yù)處理及數(shù)據(jù)準(zhǔn)備


第四部分:分類預(yù)測(cè)模型實(shí)戰(zhàn)

1、常見分類預(yù)測(cè)的模型與算法

2、如何評(píng)估分類預(yù)測(cè)模型的質(zhì)量

? ?查準(zhǔn)率

? ?查全率

? ?ROC曲線

3、邏輯回歸分析模型

? ?邏輯回歸的原理

? ?邏輯回歸建模的步驟

? ?邏輯回歸結(jié)果解讀

案例:用sklearn庫(kù)實(shí)現(xiàn)銀行貸款違約預(yù)測(cè)


4、決策樹模型

? ?決策樹分類的原理

? ?決策樹的三個(gè)關(guān)鍵問(wèn)題

? ?決策樹算法與實(shí)現(xiàn)

案例:電力竊漏用戶自動(dòng)識(shí)別


5、人工神經(jīng)網(wǎng)絡(luò)模型(ANN)

? ?神經(jīng)網(wǎng)絡(luò)概述

? ?神經(jīng)元工作原理

? ?常見神經(jīng)網(wǎng)絡(luò)算法(BP、LM、RBF、FNN等)

案例:神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)產(chǎn)品銷量


6、支持向量機(jī)(SVM)

? ?SVM基本原理

? ?維災(zāi)難與核心函數(shù)

案例:基于水質(zhì)圖像的水質(zhì)評(píng)價(jià)


7、貝葉斯分析

? ?條件概率

? ?常見貝葉斯網(wǎng)絡(luò)


第五部分:數(shù)值預(yù)測(cè)模型實(shí)戰(zhàn)

1、常用數(shù)值預(yù)測(cè)的模型

? ?通用預(yù)測(cè)模型:回歸模型

? ?季節(jié)性預(yù)測(cè)模型:相加、相乘模型

? ?新產(chǎn)品預(yù)測(cè)模型:珀?duì)柷€與龔鉑茲曲線

2、回歸分析概念

3、常見回歸分析類別


第六部分:聚類分析(客戶細(xì)分)實(shí)戰(zhàn)

1、客戶細(xì)分常用方法

2、聚類分析(Clustering)

? ?聚類方法原理介紹及適用場(chǎng)景

? ?常用聚類分析算法

? ?聚類算法的評(píng)價(jià)

案例:使用SKLearn實(shí)現(xiàn)K均值聚類

案例:使用TSNE實(shí)現(xiàn)聚類可視化


3、RFM模型分析

? ?RFM模型,更深入了解你的客戶價(jià)值

? ?RFM模型與市場(chǎng)策略

案例:航空公司客戶價(jià)值分析


第七部分:關(guān)聯(lián)規(guī)則分析實(shí)戰(zhàn)

1、關(guān)聯(lián)規(guī)則概述

2、常用關(guān)聯(lián)規(guī)則算法

3、時(shí)間序列分析

案例:使用apriori庫(kù)實(shí)現(xiàn)關(guān)聯(lián)分析

案例:中醫(yī)證型關(guān)聯(lián)規(guī)則挖掘


第八部分:案例實(shí)戰(zhàn)(學(xué)員主導(dǎo),老師現(xiàn)場(chǎng)指導(dǎo))

1、實(shí)戰(zhàn)1:電商用戶行為分析及服務(wù)推薦

2、實(shí)戰(zhàn)2:基于基站定位數(shù)據(jù)的商圈分析


結(jié)束:課程總結(jié)與問(wèn)題答疑。


全部評(píng)論 (0)

Copyright©2008-2024 版權(quán)所有 浙ICP備06026258號(hào)-1 浙公網(wǎng)安備 33010802003509號(hào) 杭州講師網(wǎng)絡(luò)科技有限公司
講師網(wǎng) kasajewelry.com 直接對(duì)接10000多名優(yōu)秀講師-省時(shí)省力省錢
講師網(wǎng)常年法律顧問(wèn):浙江麥迪律師事務(wù)所 梁俊景律師 李小平律師