Cloudera Hadoop管理认证培训

课程介绍
通过Hadoop配置管理培训,学员可以深入理解Hadoop技术架构,对Hadoop运作机制有清晰全面的认识,配置hadoop用户权限及MapReduce管理,独立规划及部署生产环境的Hadoop集群,并对Hadoop集群进行管理和优化。

课程对象:云计算管理员,大数据管理及开发人员,项目经理,架构师及对Cloudera APACHE Hadoop感兴趣人员。

课程长度:4天

最新时间:定制课程(内训),人满开班(公开课)

传统的面对面授课方式。

 

课程大纲:

1.    网络配置
     a)    Redhat网络配置向导
     b)    网络设备配置文件
2.    软件安装
    a)     rpm使用
    b)    yum配置与使用
    c)    安装java
    d)    手动编译安装
3.    Linux开机服务
    a)    运行级别及相关目录
    b)    服务的激活和关闭
    c)     rc.local
4.    磁盘和文件系统
    a)     磁盘的识别
    b)    分区管理
    c)    创建文件系统
    d)    文件系统标签
    e)    文件系统的挂载
    f )    卸载文件系统
    g)    ext4/xfs文件系统原理
5.    用户工作环境
    a)     shell工作环境
    b)    用户脚本
    c)    用户控制台任务管理
    d)    配置java运行环境
6.    Hadoop介绍
    a)    Hadoop项目简介
    b)    Hadoop生态系统
    c)    HDFS分布式文件系统
    d)    HBase简介
    e)   Hive和Pig简介
    f)    MapReduce分布式计算框架
7.    HDFS部署演示
    a)    Hadoop安装步骤
    b)    HDFS命令工具
    c)    HDFS后台服务
    d)    日志分析
    e)    WEB控制台
    f)    HDFS配置参数
8.    HDFS部署实战
    a)    Hadoop安装规划
    b)    虚拟机节点安装
    c)     Hadoop工程项目准备
    d)    虚拟机网络环境部署
    e)     Hadoop安装实战
     f)     Hadoop运行环境配置
    g)    测试HDFS
9.    MapReduce分布式计算框架
    a)     MapReduce服务
    b)    MapReduce工作机制
    c)    MapReduce调度管理
    d)    MapReduce服务
    e)    MapReduce日志
    f)    WEB控制台
10.    集群管理
    a)     性能评估
    b)    状态查看
    c)    模拟失效
    d)    节点删除
    e)    元数据备份
11.    Apache Hive
    a)    加载数据到Hive
    b)    使用Hive操作数据
    c)    分区和封装
    d)    高级Hive特性
12.    分布式计算案例部署和分析