課程(cheng)描述INTRODUCTION
Hadoop大數據平臺課程培訓
日程安排SCHEDULE
課程(cheng)大綱(gang)Syllabus
Hadoop大數據平臺課程培訓
【課程背景】
數(shu)(shu)(shu)(shu)(shu)字(zi)化浪潮是(shi)人類正在經歷的(de)(de)第五次信息革(ge)命。數(shu)(shu)(shu)(shu)(shu)字(zi)化一(yi)方面(mian)使得信息的(de)(de)搜(sou)集、存儲、處理、分發具有了前所未有的(de)(de)效率;另一(yi)方面(mian),使得信息從(cong)其(qi)附著物上分離出來,得以(yi)獨立于實(shi)物、空間和(he)(he)時間而存在。數(shu)(shu)(shu)(shu)(shu)字(zi)化是(shi)大(da)(da)數(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)根本(ben)(ben)(ben)(ben)。大(da)(da)數(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)本(ben)(ben)(ben)(ben)質是(shi)對事物規律的(de)(de)深(shen)刻洞(dong)察。學習大(da)(da)數(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)需(xu)要掌握其(qi)特(te)征描(miao)述,包(bao)括大(da)(da)數(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)技術(shu)(shu)特(te)征和(he)(he)大(da)(da)數(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)價值(zhi)邏(luo)輯。本(ben)(ben)(ben)(ben)次課(ke)程(cheng)授課(ke)范(fan)圍為(wei)大(da)(da)數(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)技術(shu)(shu)特(te)征。本(ben)(ben)(ben)(ben)課(ke)程(cheng)分為(wei)理論(lun)和(he)(he)實(shi)踐兩部分。理論(lun)部分主要帶(dai)學員(yuan)(yuan)了解(jie)(jie)大(da)(da)數(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)基(ji)本(ben)(ben)(ben)(ben)概念和(he)(he)關(guan)鍵技術(shu)(shu),介紹(shao)當前大(da)(da)數(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)平(ping)臺的(de)(de)基(ji)本(ben)(ben)(ben)(ben)架(jia)構,重點介紹(shao)Hadoop生態系統框架(jia)及其(qi)HDFS、YARN、MapReduce2.0、Hbase、Zookeeper等組件的(de)(de)原理及應用。帶(dai)學員(yuan)(yuan)了解(jie)(jie)Hadoop大(da)(da)數(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)平(ping)臺的(de)(de)運維,幫助學員(yuan)(yuan)建(jian)立完(wan)整的(de)(de)大(da)(da)數(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)認(ren)知(zhi)體(ti)系。實(shi)踐課(ke)程(cheng)為(wei)Hadoop實(shi)驗課(ke)程(cheng)。帶(dai)領學員(yuan)(yuan)動(dong)手(shou)搭(da)建(jian)Hadoop環境,完(wan)成Spark計算框架(jia)的(de)(de)搭(da)建(jian),完(wan)成XXX和(he)(he)XXX兩個操作實(shi)驗。
【課程特點】
授課形式:理論講解+動手實驗
時間安排:系統學習1天(6小時)
理論講(jiang)解與動手(shou)實(shi)(shi)驗(yan)相結(jie)合。其中理論講(jiang)解占(zhan)50%,動手(shou)實(shi)(shi)驗(yan)占(zhan)50%。
【課程收益】
1.了解大數據的基本概念、發展歷程、主流技術和應用場景等。通過分析大數據平臺在建設、生產和運維過程中出現的問題,幫助學員逐步形成解決問題的思路。
2.通過實驗(yan)課程掌握Hadoop生態系統基本組件的(de)運用。學會使用MapReduce和(he)Spark計算框架解決實際問題。
【受眾對象】
1.云計算和電信行業領域的技術人員、管理人員、政企客戶經理、產品經理、項目經理
2.管理支持組織中數據中心運行、規劃、設計負責人
3.希(xi)望提升自身職業能力的人(ren)員(yuan)、其他對大數據技術感興趣的人(ren)員(yuan)
【課程內容】
一.大數據基本概念及關鍵技術
1.大數據的基本概念
●信息革命與數字化浪潮
●大數據的產生背景定義和特征
●大數據與云計算的關系
●大數據的影響
●大數據在行業的價值體現
2.大數據的關鍵技術
●傳統架構的局限性
●大數據理論基礎
●大數據總體架構和關鍵技術
●大數據匯聚
●大數據處理
●大數據分析
●大數據展現
●大數據開放
二.大數據平臺架構
1.大數據平臺詳細架構
●大數據平臺功能邏輯架構
●Hadoop集群架構
●MPP集群架構
●流處理+內存數據庫架構
●大數據平臺數據流程
●大數據平臺的管理
●大數據平臺能力開放
2.行業大數據平臺
●某運營商大數據平臺
●某銀行大數據平臺
●某互聯網公司大(da)數(shu)據平臺
三.Hadoop生態系統
1.初識Hadoop
●Hadoop生態系統
●Hadoop歷史版本變遷介紹
●Hadoop基本組件
2.Hadoop三大組件的原理
●分布式文件系統原理
●HDFS原理
●HDFS讀寫過程
●MapReduce基本原理
●MapReduce框架
●Wordcount案例
●MapReduce內部邏輯
●資源管理系統YARN
●YARN的作用
●YARN的基本原理
3.Hadoop生態系統
●Hadoop1.0~Hadoop3.0演進歷史
●Hive和Pig優劣勢
●Mahout工具
●Hbase原理
●Hbase數據模型
●Hbase物理模型
●ZooKeeper
●Sqoop
●Flume
四.Hadoop平臺運維
1.Hadoop平臺運維
●自動擴縮容
●資源監控
●資源分配管理
●權限管理
●平臺容災
2.Hadoop平臺運維案例
●Hadoop集群訪問安全控制
●Hadoop存儲共享計算隔離設計
●實時查詢庫Hbase多實例
●Flume集群高可用
●HDFS磁盤檢查機制優(you)化
五.動手實驗
1)Hadoop安裝
●Hadoop安裝-獲取linux操作系統
●Hadoop安裝-安裝JDK
●Hadoop安裝-配置hadoop
2)Hadoop的核心-HDFS簡介
●數據管理策略
●HDFS特點
●HDFS文件讀寫操作
3)Hadoop的核心-MapReduce原理與實現
●MapReduce的原理
●MapReduce的運行流程
●實驗一:WordCount單詞計數實例
●分片輸入—Map—Shuffle—Reduce過程總結
4)開發Hadoop應用程序
●相似度算法
●基于物品的推薦算法原理
●基于物品的推薦算法實戰
●實驗總結
補充章節 人工智能
1)未來已來
2)人工智能概念和應用
3)機器學習原理
4)云計算和大數據驅動深度學習
5)機器學習平(ping)臺架(jia)構(gou)
Hadoop大數據平臺課程培訓
轉載://citymember.cn/gkk_detail/36883.html
已開(kai)課(ke)時間(jian)Have start time
- 唐杰
大數據課程內訓
- 《流量神器,銷量升級:如何 武建偉
- 企業區塊鏈技術的應用場景與 李(li)璐(lu)
- 《銀行--網絡消費行為與網 武建偉(wei)
- 《精細運營——京東/天貓平 武建偉
- 建材門店--微信獲客與運營 武建偉
- 能源電力企業數字化轉型探索 李(li)開東
- 數據創造價值——大數據分析 張曉如
- 《大數據精益化營銷思維與運 喻國(guo)慶
- 大數據項目解決方案及應用 胡國慶(qing)
- 大數據提升:用戶體驗提升與 武(wu)建偉
- 數據驅動價值 ——基于Ex 張曉如
- 《大數據分析與客戶開發》 喻國慶