班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
坚持小班授课,为保证培训效果,增加互动环节,每期人数限3到5人。 |
上课时间和地点 |
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
近开课时间(周末班/连续班/晚班):2024年12月30日......(欢迎您垂询,视教育质量为生命!) |
实验设备 |
☆资深工程师授课
☆注重质量
☆边讲边练
☆合格学员免费推荐工作
★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
3、培训合格学员可享受免费推荐就业机会。 |
课程大纲 |
第一部分除了Hadoop框架以外,大数据界的现状与展望,机遇与挑战,开源项目的注意事项(尤其对大型企业)也会在课程中介绍和研讨,内容以思路,框架和架构为主
第二部分边学变练,内容以应用编程为主,掌握基本的Hadoop编程原理
第三部分边学边练,了解MapReduce之上的封装Pig以及Hive,以及数据跨平台传输工具Sqoop,研讨关系型数据库与大数据框架的主要应用差异
第四部分边学边练,了解NOSQL计算框架HBase,流计算框架Storm,了解高可用配置管理工具ZooKeeper
课程大纲:
第1部分
大数据基础与Hadoop框架 数据分析概述
数据的演变
传统数据库面临的挑战
大数据处理的机遇
业务分析经典案例:啤酒与尿布
IT分析经典场景:数据中心容量规划
IBM Watson——基于大数据的认知计算
大数据的人才需求:大数据方案 ≠ Hadoop
大数据的人才需求:大数据总体架构
大数据的人才培养:从云计算起源说起
大数据的人才培养:理论结合实践
Hadoop概述
数据存储与分析
数据的并行访问
Hadoop的核心组件
Hadoop的基本特征
Hadoop的生态圈
Hadoop与大数据
Hadoop与关系型数据库
Hadoop发展简史
开源项目注意事项
组织结构
技术路线把控
协议与授权
构建Hadoop集群
集群安装与配置
SSH的配置
Hadoop的配置
安全相关的考虑
集群性能指标
云上的Hadoop
第2部分
MapReduce与HDFS MapReduce
什么是MapReduce
使用MapReduce进行数据分析
MapReduce横向扩展
MapReduce数据流
Combine函数
MapReduce 2.0
非Java语言支持
实践:基于Eclipse的Hadoop开发环境搭建
实践:使用MapReduce编写北京市小汽车摇号中签姓名统计程序
实践:编写MapReduce程序的单元测试程序
实践:编写MapReduce程序的驱动程序
实践:在单机环境下运行MapReduce程序
实践:使用Ant脚本部署MapReduce程序并在分布式环境下运行
实践:使用Hadoop Web控制台查看作业输出
HDFS(2小时讲授)
什么是HDFS
HDFS的优势与劣势
HDFS的数据块
Namenode与Datanode
Hadoop客户端
Namenode的高可用
Hadoop支持的各种文件系统
Hadoop支持的各种接口
文件读取的数据流
文件写入的数据流
网络拓扑与hadoop
CAP定理在Hadoop中的展现:一致性模型与应用注意事项
distcp并行复制
集群的均衡
文件的归档
实践:编写Hadoop程序打印系统配置
实践:编写Hadoop程序将本地文件拷贝到HDFS上
实践:编写Hadoop程序显示文件内容
实践:编写Hadoop程序列出文件状态
第3部分
Pig,Hive,Sqoop Pig Latin及其使用
Pig 设计的目标
Pig Latine介绍
Pig关键性技术
Pig的实用案例
HIVE:分布式环境下的数据分析平台
MapReduce与关系型数据模型
什么是HIVE
HIVE系统架构
HIVE数据模型
HIVE数据类型
HIVE查询语言
HIVE查询实例与应用场景
HIVE列存储的优劣
HIVE的扩展属性
Sqoop
什么是Sqoop
导入数据的数据流
导入数据的查询划分
直接模式数据导入
使用导入的数据
导入数据到HIVE
大对象
导出数据的数据流
导出与事物
关系型数据库与大数据系统进行数据迁移的注意事项
第4部分
流数据处理,
高可用配置管理与跨平台数据迁移工具 HBASE:非结构化数据NOSQL平台
Hbase概述
HBase的数据模型
HBase的实现
HBase的运行时
服务器的写操作与宕机恢复
服务器的读操作
使用hbase shell进行表相关操作
通过Java客户端实现表相关操作
通过MapReduce程序实现数据处理
将数据加载到HBase中
数据加载的性能
HBase与关系型数据库
Hadoop用户在HBase的常见问题
分布式流数据处理
Storm概述
Storm的拓扑组成
Storm的简单实例与应用
Spark概述
Spark计算模型
Spark工作机制
Spark实例
ZooKeeper:分布式环境下的高可用架构
什么是ZooKeeper
分布式环境的部分失效
ZooKeeper的特点
一个分布式的问题
ZooKeeper的组、成员与节点
实践:编写程序创建组、加入组、列出组成员与删除组
分布式问题的回顾
ZooKeeper服务的数据模型
ZooKeeper服务的操作类型
ZooKeeper服务的高可用
ZooKeeper服务的一致性
实践:编写程序使用ZooKeeper构建高可靠的分布式配置服务
使用ZooKeeper时的异常处理
使用ZooKeeper实现锁服务
更多的分布式数据结构和协议 |
|
|
|