【課程內(nèi)容】
1、Hadoop分布式文件系統(tǒng)(HDFS)
2、YARN/MapReduce的工作原理
3、如何優(yōu)化Hadoop機(jī)群所需要的硬件配置
4、搭建Hadoop機(jī)群所需要考慮的網(wǎng)絡(luò)因素
5、Hadoop機(jī)群維護(hù)和控制
6、如何利用Hadoop配置選項(xiàng)進(jìn)行系統(tǒng)性能調(diào)優(yōu)
7、如何利用FairScheduler為多用戶提供服務(wù)級(jí)別保障
8、Hadoop機(jī)群維護(hù)和監(jiān)控
9、如何使用Flume從動(dòng)態(tài)生成的文件加載到Hadoop
10、如何使用Sqoop從關(guān)系型數(shù)據(jù)加載數(shù)據(jù)
11、Hadoop生態(tài)系統(tǒng)工具(如Hive、Impala、Pig和Base)
上海市信息技術(shù)培訓(xùn)中心Cloudera Hadoop開(kāi)發(fā)認(rèn)證培訓(xùn)
1、Hadoop分布式文件系統(tǒng)(HDFS)和MapReduce的工作原理
2、如何利用JAVA API或者其他編程語(yǔ)言來(lái)開(kāi)發(fā)MapReduce應(yīng)用
3、MapReduce任務(wù)開(kāi)發(fā)中的注意事項(xiàng)
4、如何在Hadoop上實(shí)現(xiàn)常見(jiàn)算法
5、Hadoop開(kāi)發(fā)和調(diào)試的*實(shí)用經(jīng)驗(yàn)
6、如何利用其他Hadoop相關(guān)技術(shù),包括Apache Hive, Apache Pig, Sqoop和Oozie等
7、滿足解決實(shí)際數(shù)據(jù)分析問(wèn)題的高級(jí)Hadoop API
上海市信息技術(shù)培訓(xùn)中心Cloudera數(shù)據(jù)分析培訓(xùn)
【課程內(nèi)容】 1、Hive如何擴(kuò)展MapReduce
2、如何使用Hive創(chuàng)建和操作表
3、Hive基本和高級(jí)數(shù)據(jù)類型
· 4、對(duì)數(shù)據(jù)進(jìn)行分區(qū)和分組
5、如何用Pig加載和操作數(shù)據(jù)
6、PigLatin編程語(yǔ)言的特性
7、用Pig解決實(shí)際數(shù)據(jù)分析問(wèn)題
8、使用Impala分析數(shù)據(jù)
上海市信息技術(shù)培訓(xùn)中心Cloudera HBase培訓(xùn)
【課程內(nèi)容】
1、理解HBase體系結(jié)構(gòu)及應(yīng)用場(chǎng)景
2、使用HBase Shell來(lái)直接操作HBase數(shù)據(jù)庫(kù)
3、使用JAVA及Thrift API訪問(wèn)及操作HBase數(shù)據(jù)庫(kù)系統(tǒng)
4、如何管理HBase機(jī)群,發(fā)現(xiàn)和解決性能問(wèn)題
5、如何優(yōu)化HBase數(shù)據(jù)模式來(lái)進(jìn)行高效地?cái)?shù)據(jù)存儲(chǔ)和數(shù)據(jù)恢復(fù)