課程描述INTRODUCTION
Python時序模型
日(ri)程(cheng)安排SCHEDULE
課程大綱Syllabus
Python時序模型
【課程目標】
本課程為中級課程《大數據建模》的第二篇:時序篇
本課程主要講解如何利用Python進行時間序列的數據建模,幫助學員構建系統全面的預測建模思維,提升學員的數據建模綜合能力。
本系列課程從實際的業務需求出發,結合行業的典型應用特點,圍繞實際的商業問題,對數據預測建模的過程進行了全面的介紹(從模型選擇,到屬性選擇,再到訓練模型,評估模型以及優化模型),通過大量的操作演練,幫助學員掌握數據建模的思路、方法、技巧,以提升學員的數據建模的能力,支撐運營決策的目的。
通過本課程的學習,達到如下目的:
1、掌握數據建模的標準流程。
2、掌握時序預測建模的基本思想,理解因素分解的思路。
3、掌握常用的趨勢擬合模型。
4、掌握常用的季節預測模型,能夠進行季節周期性的時序建模。
5、深刻理念平穩序列的概念,以及平穩性檢驗。
6、掌握平穩序列的模型識別,以及模型定階。
7、掌握時序預測模型的評估,以及優化。
8、掌握高級時(shi)序模型的訓練與建(jian)模。
【授課對象】
業務支撐部(bu)、運營分(fen)析部(bu)、數(shu)據(ju)分(fen)析部(bu)、IT系統(tong)部(bu)、大數(shu)據(ju)系統(tong)開發部(bu)等(deng)相關技術人(ren)員。
【課程大綱】
一、預測建模基礎
1、數據建模六步法
-選擇模型:基于業務選擇恰當的數據模型
-屬性篩選:選擇對目標變量有顯著影響的屬性來建模
-訓練模型:采用合適的算法,尋找到最合適的模型參數
-評估模型:進行評估模型的質量,判斷模型是否可用
-優化模型:如果評估結果不理想,則需要對模型進行優化
-應用模型:如果評估結果滿足要求,則可應用模型于業務場景
2、數據挖掘常用的模型
-數值預測模型:回歸預測、時序預測等
-分類預測模型:邏輯回歸、決策樹、神經網絡、支持向量機等
-市場細分:聚類、RFM、PCA等
-產品推薦:關聯分析、協同過濾等
-產品優化:回歸、隨機效用等
-產品定價:定價策略/最優定價等
3、屬性篩選/特征選擇/變量降維
-基于變量本身特征
-基于相關性判斷
-因子合并(PCA等)
-IV值篩選(評分卡使用)
-基于信息增益判斷(決策樹使用)
4、訓練模型及實現算法
-模型原理
-算法實現
5、評估模型
-評估指標
-評估方法
-殘差評估
6、模型優化
-優化模型:選擇新模型/修改模型
-優化數據:新增顯著自變量
-優化公式:采用新的計算公式
7、模型應用
-模型解讀
-模型保存/加載
-模型應用/預測
8、好模型是優化出來的
二、時序模型評估
1、評估指標
-判定系數:和
-平均誤差:MAE
-根均方差:RMSE
-平均誤差率:MAPE
2、信息準則指標
-赤池信息準則(Akaike Information Criterion,AIC)
-貝葉斯信息準則(Bayesian Information Criterion,BIC)
-HQIC(Hannan-Quinn Information Criterion,HQIC)
3、評估方法
-滾動交叉驗證法(cross validation)
4、其它評估
-殘差評估:白噪聲評估
三、趨勢預測模型
問題:無法找到影響因素,無法回歸建模,怎么辦?隨著業務受季節性因素影響,未來的銷量如何預測?
1、時間序列簡介
2、時序預測的原理及應用場景
3、常見時序預測模型
-趨勢類預測模型
-季節類預測模型
-平穩時序預測模型
-其它高級模型
4、移動平均
-應用場景及原理
-理解滑動窗口
-移動平均種類
-一次移動平均
-二次移動平均
-加權移動平均
-移動平均比率法
-移動平均關鍵問題
-*期數N的選擇原則
-最優權重系數的選取原則
演練:銷售額預測模型及評估
演練:快銷產品季節銷量預測及評估
5、指數平滑
-應用場景及原理
-最優平滑系數的選取原則
-指數平滑種類
-一次指數平滑
-二次指數平滑(Brown線性)
-三次指數平滑
演練:煤炭產量預測
6、Holt趨勢模型(亦稱二次指數平滑)
-Holt線性模型
-Holt指數模型
-阻尼線性趨勢
-阻尼指數趨勢
四、季節預測模型
1、因素分解思想
2、時間序列的四個構成要素
-長期趨勢Trend
-季節變動Seasonality
-循環變動Circle
-不規則變動Irregular
案例:時間序列的季節分解
3、Holt-Winters季節模型
-三個組成部分
-三個平滑因子
4、HW加法模型
-適用場景
-計算公式
-超參優化
-模型解讀
5、HW乘法模型
6、HW指數模型
案例:航空飛行里程預測模型
案例:汽車銷量預測模型
案例:沃爾瑪收益預測模型
7、基于回歸的季節模型
-相加模型
-相乘模型
-模型訓練及優化
-模型解讀
五、平穩序列模型
1、平穩序列預測模型簡介
2、序列平穩性概念
-恒定的均值
-恒定的標準差
-與位置無關的協方差
3、序列平穩性檢驗
-折線圖法
-ACF/PACF圖
-ADF檢測法
4、特殊平穩序列:白噪聲
案例:序列平穩性檢驗
案例:白噪聲檢驗
5、平穩序列常用擬合模型
-AR(p)自回歸模型
-MA(q)移動平均模型
-ARMA(p,q)自回歸移動平均模型
6、模型識別
-ACF圖
-PACF圖
7、模型定階
-圖形定階(ACF/PACF)
-最小信息準則定階
8、非平穩序列處理
-平滑法
-變量變換
-差分運算:k步差分與d階差分
9、ARIMA(p,d,q)建模流程
案例:上海證券交易所收盤價建模
10、SARIMA(p,d,q)(P,D,Q,S)模型
-圖形確定階數
-遍歷確定階數
11、時序模型總結
六、模型質量評估篇
1、回歸模型的評估指標
-三個基本概念:SSR/SST/SSE
-兩個判定系數:R^2,調整R^2
-三個誤差指標:MAE/MAPE/RMSE
-平均*誤差MAE
-均方差MSE/RMSE
-平均誤差率MAPE
2、模型的評估方法
-原始評估法
-留出法(Hold-Out)
-交叉驗證法(k-fold cross validation)
-自助采樣法(Bootstrapping)
3、時間序列的滾動交叉驗證
七、高級時序模型
1、Prophet模型介紹
-趨勢擬合
-季節性預測
-節假日和特殊事件的影響
-離群值分析
案例:銷售額時序預測模型
2、LSTM模型簡介
-數據集構造
-形狀構造
-滾動預測
八、廣(guang)告點擊量時(shi)序建模(mo)
結束:課程總結與問題答疑。
Python時序模型
轉載://citymember.cn/gkk_detail/265683.html
已開課(ke)時間Have start time
- 傅一航
IT相關內訓
- Fine BI 數據分析與 張曉如
- IT崗位數智化能力提升路徑 甄文智
- 網安管理崗培訓 張勝生(sheng)
- 電力信息化:價值和建設分析 劉(liu)宇佳(jia)
- 信息安全風險評估與加固技能 張勝生
- 云計算的應用領域和實踐 武威
- 大模型技術與應用培訓 葉梓
- 滲透測試與攻防實戰高級課程 張(zhang)勝生
- CISSP認證培訓課程 張勝生
- 互聯網新技術在銀行的應用 武威(wei)
- 軟件安全意識加強與技能提高 張勝生
- Python高效辦公自動化 張曉如(ru)