課程描述INTRODUCTION
數據挖掘與大數據技術
日程安排(pai)SCHEDULE
課程(cheng)大綱Syllabus
數(shu)據(ju)挖(wa)掘與大數(shu)據(ju)技術
課程簡介:
本次課程將介紹數(shu)(shu)據(ju)(ju)挖(wa)(wa)掘(jue)與大(da)數(shu)(shu)據(ju)(ju)技術(shu)的(de)(de)(de)基本理論和體(ti)系架構,通過(guo)大(da)型數(shu)(shu)據(ju)(ju)挖(wa)(wa)掘(jue)和大(da)數(shu)(shu)據(ju)(ju)處理項(xiang)目案例(li)闡述數(shu)(shu)據(ju)(ju)挖(wa)(wa)掘(jue)和大(da)數(shu)(shu)據(ju)(ju)項(xiang)目的(de)(de)(de)實(shi)施過(guo)程和方法。通過(guo)實(shi)際(ji)(ji)應用案例(li)講解數(shu)(shu)據(ju)(ju)清洗、數(shu)(shu)據(ju)(ju)預處理、數(shu)(shu)據(ju)(ju)挖(wa)(wa)掘(jue)算法等重要概(gai)念。詳(xiang)細講解構建(jian)(jian)數(shu)(shu)據(ju)(ju)挖(wa)(wa)掘(jue)體(ti)系的(de)(de)(de)核(he)心方法和技術(shu),并結合實(shi)際(ji)(ji)項(xiang)目搭建(jian)(jian)數(shu)(shu)據(ju)(ju)挖(wa)(wa)掘(jue)環(huan)境。熟悉主(zhu)流(liu)數(shu)(shu)據(ju)(ju)挖(wa)(wa)掘(jue)廠商及相關軟件產品的(de)(de)(de)操作和使用。
課程特點:
1、 培訓過程中將以大型項目案例為背景,逐步講解整個數據挖掘的設計過程和實施方法
2、 課程將以深入淺出的案例讓學員輕松掌握數據挖掘相關概念和技術
3、 課程的重點是項目實施,將深入探討數據挖掘項目的實施問題,逐一解決項目實施過程中所遇到的問題和處理技巧
4、 結合(he)動手實驗(yan)和小而(er)精的例子(zi),使(shi)學員充分理解(jie)數(shu)據(ju)挖掘架構設(she)計和相(xiang)關(guan)實施工具的使(shi)用(yong)
課程大綱:
專題一:數據挖掘基礎知識
內容一:數據挖掘基本概念
1、 數據挖掘的來源
2、 數據挖掘的定義
3、 數據挖掘的應用領域
4、 數據挖掘的行業背景
內容二:BI的架構
1、BI體系介紹
2、數據倉庫介紹
3、ETL介紹
4、多維數據庫介紹
5、前端展現介紹
6、數據挖掘模型介紹
內容三、數據挖掘在行業中的應用
1、現代企業數據挖掘需求概述
2、電信行業案例分析
3、金融行業案例研究
4、銷售行業案例分析
5、BI系統數據更新與維護
介紹數(shu)據挖掘基本概念,BI體系架(jia)構, 數(shu)據挖掘工具(ju)介紹及(ji)其應(ying)用,針對電信等行業提(ti)供行業解(jie)決方(fang)案(an)和(he)案(an)例分析。
專題二:數據挖掘架構設計與完整流程詳解
內容一:九種數據挖掘算法
1、 九種挖掘算法應用的背景
2、 決策樹算法與模型設計
3、 聚類算法與模型設計
4、 關聯規則算法與模型設計
5、 貝葉斯算法與模型設計
6、 時間序列算法與模型設計
7、 其他挖掘算法與模型設計
內容二:常用挖掘模型詳解
1、決策樹算法詳解及工具實現
2、聚類算法詳解及工具實現
3、關聯規則算法詳解及工具實現
4、貝葉斯算法詳解及工具實現
5、時間序列算法詳解及工具實現
6、數據挖掘模型評估
內容三:數據挖掘的流程
1、數據清洗準備
2、數據預處理
3、選擇數據挖掘模型
4、數據挖掘模型訓練
5、更新算法模型
6、模型評估
7、部署與應用
內容四:DMX語言
1、DMX語法結構
2、使用DMX創建挖掘模型
3、使用DMX將挖掘結果導出
4、使用DMX進行挖掘模型參數設置
九(jiu)種(zhong)數據(ju)挖(wa)掘算(suan)法與(yu)模型詳(xiang)解,數據(ju)挖(wa)掘的設計與(yu)實施流程,數據(ju)挖(wa)掘查詢語(yu)言(yan)的使用等(deng),重(zhong)點對(dui)決策(ce)樹算(suan)法、關聯規則算(suan)法、聚類算(suan)法等(deng)給出詳(xiang)細(xi)設計和處理流程。
專題三:大數據處理優化部分
內容一:大數據的特點
1、什么是大數據
2、大數據的特點
3、大數據在行業中的應用
內容二:大數據優化方法詳解
1、大數據分區處理
2、使用中間表和臨時表
3、分批次處理與并行計算
4、建立廣泛的索引
5、建立緩存機制
6、使用文本和二進制格式進行處理
7、定制強大的清洗規則和出錯處理機制
8、建立視圖或者物化視圖
9、其他優化方法總結
內容三:數據倉庫中大數據的處理方式
1、數據倉庫中的大數據特點
2、數據倉庫中的大數據的處理方式
3、分布式數據倉庫的特點及應用
內容四:大數據高級應用
1、大型項目中大數據的優化案例分析
2、使用大數據優化工具
3、數據倉庫中的大數據性能調優技巧
4、未來大數據的發展方向
大數(shu)(shu)據(ju)的(de)概念、特(te)點以(yi)及(ji)大數(shu)(shu)據(ju)的(de)優(you)化方法(fa),數(shu)(shu)據(ju)倉庫(ku)項目中大數(shu)(shu)據(ju)的(de)處理(li)方式以(yi)及(ji)大數(shu)(shu)據(ju)的(de)高級應用等,針對大型數(shu)(shu)據(ju)倉庫(ku)項目提供了(le)完備的(de)大數(shu)(shu)據(ju)優(you)化解決方案。
專題四:數據挖掘與大數據項目案例分析
內容一:中國電信數據挖掘項目
1、項目介紹
2、復雜多系統多數據源的特點
3、ODS的使用
4、整體項目架構設計
5、數據挖掘算法選取
6、數據挖掘模型設計
7、數據挖掘處理流程
8、數據抽取策略的制定
8、挖掘模型的更新技巧
內容二:Search Funnel數據挖掘項目
1、項目介紹
2、項目中的海量數據
3、數據挖掘算法
4、數據挖掘模型構建
5、數據的預處理技術
6、對挖掘模型進行訓練
7、展示數據挖掘模型結果
8、數據挖掘模型評估
內容三:MSN大數據處理項目
1、項目介紹
2、項目中的超海量數據
3、大數據處理所遇到的問題
4、使用并行處理和計算
5、大數據項目中的數據挖掘模型處理
6、項目中的報表展現
7、大數據處理思路總結
內容四:AdventureWorks整體項目案例
1、案例介紹
2、ETL流程詳解
3、OLAP流程詳解
4、前端報表流程詳解
5、數據挖(wa)掘流(liu)程詳解(jie)
總結
大(da)型數據(ju)倉(cang)庫與(yu)數據(ju)挖掘項目設(she)計(ji)和實(shi)施,重點對項目架構(gou)設(she)計(ji)和數據(ju)完整(zheng)處(chu)理(li)流程做重點分析和詳細介紹,針(zhen)對大(da)型數據(ju)挖掘項目,提供(gong)了完備的解決方案(an),給出(chu)完整(zheng)設(she)計(ji)思路(lu)和數據(ju)處(chu)理(li)技(ji)術應用。
數據挖掘與大數據技術
轉載://citymember.cn/gkk_detail/257420.html
已開課時間(jian)Have start time
- 張曉誠
大數據營銷內訓
- 建材門店--微信獲客與運營 武建偉
- 《大數據精益化營銷思維與運 喻國慶
- 《精細運營——京東/天貓平 武建(jian)偉
- 《流量神器,銷量升級:如何 武建偉
- 企業區塊鏈技術的應用場景與 李璐
- 數據驅動價值 ——基于Ex 張曉(xiao)如
- 《銀行--網絡消費行為與網 武建(jian)偉
- 大數據提升:用戶體驗提升與 武建偉
- 能源電力企業數字化轉型探索 李(li)開(kai)東
- 《大數據分析與客戶開發》 喻國慶
- 數據創造價值——大數據分析 張曉如
- 大數據項目解決方案及應用 胡國慶