數據分析
講師: 瀏(liu)覽次數(shu):2543
課(ke)程描述(shu)INTRODUCTION
數據分析公開課
日程安排SCHEDULE
課(ke)程大綱(gang)Syllabus
數據分析公開課
課程大綱:
第(di)一部(bu)分、數據分析
商業數據(ju)分析
數據挖(wa)掘Road Maps
R、python簡單(dan)介紹
數據探索
數據預處理
構建新的變量
異常值(zhi)處理
數據可視化
數據分析應用流(liu)程
第二部分、分類方(fang)法(fa)
回歸分析
相關(guan)性
線性回歸(gui)與擬合
最小(xiao)二乘法的幾何解(jie)釋
線性回歸中的變量(liang)選(xuan)擇(ze)
回歸算法的(de)評估與選擇(ze)
KNN 分類(lei)器
確定相鄰的樣本(ben)數據
分類規則
參數K的(de)選(xuan)擇
算法優(you)缺(que)點
案例分析:如(ru)何選擇(ze)相似用戶(hu)?
邏輯回歸
邏(luo)輯回歸模型
分類算法的評估
案例分析:用戶(hu)借(jie)貸能(neng)力判定(ding)
決策樹
迭(die)代分割
純度(du)的計算
決策樹的(de)使用效果(guo)
如何避(bi)免(mian)過(guo)擬合
剪枝與(yu)終止(zhi)條件(jian)
案(an)例分析:如何利用決策樹(shu)的(de)提(ti)取出(chu)業務規則?
(補充)樹模(mo)型(xing)應用——隨機森(sen)林
案(an)例分析(xi):如(ru)何幫(bang)助業務方篩選出(chu)重要的(de)業務變量?
第三部分、聚類算法
聚類問題介紹
兩條數據之(zhi)間(jian)的距離
歐式距離(li)
數值(zhi)型數據(ju)處理與距離函數
類別型數據的距(ju)離計算
混合類(lei)型數據的(de)距離計算
兩個類別之間的(de)距離
*距離、最小聚類、中心距離
K-means
如何選擇參數(shu)K
層(ceng)次聚類
案例分析:如何(he)選(xuan)擇(ze)相似用戶(hu)?
第四部分、異常檢測(ce)
異(yi)常值檢測
異常團體識別
案例分(fen)析:無(wu)監督反欺詐方案應用
業(ye)務思(si)考:如何構建一個反欺詐系統?
第五部分、時間序列預測
時間序列回歸模(mo)型
預測變量篩選(xuan)
回歸(gui)預測
非(fei)線性回歸
相關(guan)、因(yin)果和預測
時間(jian)序列分解
時間序(xu)列(lie)成分
移動平均
經(jing)典時間(jian)序列分解
ST分解法
趨勢性、季節性判定
業務思考:如何對時間序列進行聚類?
分解法預測(ce)
時間(jian)序列類(lei)異常值檢測
業務思考(kao):如何(he)評(ping)估促銷活動效(xiao)果?
ARIMA模型
平(ping)穩性和差分(fen)
延遲算(suan)子
自回歸(gui)與移動平均(jun)
非季(ji)節性arima
參數估(gu)計與選擇
季節性arima
高級預測方法
復雜的季節性
向量自(zi)回歸(gui)
神經網絡
實際預測問題
周數據、天(tian)粒度數據以及小(xiao)時數據預(yu)測
預測組合
長序列與短序列預測
訓練集與測試集
缺失值(zhi)與異常值(zhi)
案例分享:共享單車Daiy天(tian)粒度(du)需求預測(ce)
數據分析公開課
轉載://citymember.cn/gkk_detail/229458.html
已開課時間(jian)Have start time
大數據課程內訓
- 大數據提升:用戶體驗提升與 武建偉
- 數據創造價值——大數據分析 張曉(xiao)如
- 大數據項目解決方案及應用 胡國慶
- 企業區塊鏈技術的應用場景與 李璐(lu)
- 能源電力企業數字化轉型探索 李開東
- 《精細運營——京東/天貓平 武建(jian)偉
- 數據驅動價值 ——基于Ex 張曉如(ru)
- 《大數據精益化營銷思維與運 喻(yu)國慶
- 《大數據分析與客戶開發》 喻國慶
- 《銀行--網絡消費行為與網 武建偉
- 《流量神器,銷量升級:如何 武建偉
- 建材門店--微信獲客與運營 武(wu)建偉