hadoop 大数据技术培训 5天
hadoop 大数据技术培训 5天详细内容
hadoop 大数据技术培训 5天
大数据处理技术培训
课程介绍
Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高 容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。
课程目标
掌握大数据方法体系
掌握Hadoop原理技术
熟悉各项大数据处理手段和工具的使用。
培训对象
全省互联网分析人员
课程长度
5天
课程内容
第1天
主题
Hadoop入门,了解什么是hadoop大纲
1、Hadoop产生背景
2、Hadoop在大数据、云计算中的位置和关系
3、国内外Hadoop应用案例介绍
4、国内Hadoop的课程大纲介绍
5、Hadoop生态圈以及各组成部分的简介
6、Hadoop核心MapReduce例子说明
主题
分布式文件系统HDFS
大纲
1、分布式文件系统DFS简介
2、HDFS的系统组成介绍
3、HDFS的组成部分详解
4、副本存放策略及路由规则
5、命令行接口
6、Java接口
7、客户端与HDFS的数据流讲解
8、HDFS的可用性(HA)
第2天
主题
初级MapReduce大纲
1、如何理解map、reduce计算模型
2、剖析伪分布式下MapReduce作业的执行过程
3、序列化
4、MapReduce的类型与格式
5、MapReduce开发环境搭建
6、MapReduce应用开发
7、更多示例讲解,熟悉MapReduce算法原理
主题
高级MapReduce大纲
1、使用压缩分隔减少输入规模
2、利用Combiner减少中间数据
3、编写Partitioner优化负载均衡
4、MapReduce优化
5、编程实战
第3天
主题
Hadoop集群与管理
大纲
1、Hadoop集群的搭建
2、Hadoop集群的监控
3、Hadoop集群的管理
4、集群下运行MapReduce程序
主题
HBase基础知识
大纲
1、HBase定义
2、HBase与RDBMS的对比
3、数据模型
4、系统架构
5、HBase上的MapReduce
6、表的设计
第4天
主题
HBase集群及其管理
大纲
1、集群的搭建过程讲解
2、集群的监控
3、集群的管理
主题
Zookeeper
大纲
1、zookeeper的功能
2、zookeeper集群搭建
3、查看zookeeper中数据的存储
第5天
主题
Hive
大纲
1、数据仓库基础知识
2、Hive定义
3、Hive体系结构简介
4、Hive集群
5、客户端简介
主题
HiveQL大纲
1、HiveQL定义
2、HiveQL与SQL的比较
3、数据类型
4、表与表分区概念
5、表的操作与CLI客户端演示
6、数据导入与CLI客户端演示
7、查询数据与CLI客户端演示
8、数据的连接与CLI客户端演示
9、用户自定义函数(UDF)的开发与演示
孙增辉老师的其它课程
信息安全5天 12.08
信息安全课程介绍本课程涵盖了信息安全从概念到细节的多个方面。本课程同样适用于初学者和专业人员,相对全面地提供了一站式的参考内容。课程目标安全基础数据安全如何保护网络上的资产网络安全计算机安全应用程序安全安全操作培训对象相关的技术人员、管理人员、运维人员课程长度5天课程内容第1天主题信息安全概述大纲信息保护的重要性信息安全的演变合理的安全投资安全方法论建立一个
讲师:孙增辉详情
应用容器引擎 Docker5天 12.08
应用容器引擎Docker课程介绍Docker是基于GO语言实现的云开源项目,诞生于2013年初。Docker希望达到应用组件级别的“一次封装,到处运行”。学员可以简单将docker容器理解为沙盒。每个容器运行一个应用,不同的容器互相隔离,容器之间也可以建立通信机制。容器的创建和停止十分快速,容器自身对资源的需求也十分有限,远远低于虚拟机。很多时候直接把容器党
讲师:孙增辉详情
云计算 openstack5天 12.08
云计算openstack课程介绍云计算从提出到成熟,中间经历了较长的时间。云计算的各种概念也在不断发展更新。本课程能够给想要学习云计算知识的人们,提供一个可供学习的云计算系统,帮助大家学习、实验和使用。课程目标了解云计算,知道云计算产生的原因以及应用场景。了解云存储,知道云计算系统中大数据的存储方式。私有云和公有云。云计算的两种不同应用场景,它们的联系与区别
讲师:孙增辉详情
mysql 4天 12.08
MYSQL数据库课程介绍本课程介绍MySQL的启动、连接等基础应用开始,SQL语句的使用、MySQL内置函数、备份与恢复、数据库优化、数据库安全等主题,介绍相关开发实例课程目标了解mysql数据库的体系结构创建和管理mysql数据库备份和恢复数据库培训对象软件开发人员、数据库管理员课程长度5天(30学时)培训方式案例分析、情景演练课程内容第1天主题体系结构大
讲师:孙增辉详情
oracle 数据库管理(DBA) 5天 12.08
Oracle数据库管理(DBA)课程介绍本课程是你作为Oracle专业人员走向成功的第一步。课程设计为你打下基本的数据库管理的坚实基础并帮助你准备通过OracleCertifiedAssociate考试。课程目标课程中,你将学习如何安装和维护Oracle数据库。学员将获得Oracle数据库结构的概念性理解,以及它的组件是如何彼此协调工作的。学员将学习如何创建
讲师:孙增辉详情
Oracle调优培训 3 天 12.08
Oracle调优培训课程介绍该培训课程面向大中型企业中的数据库相关的开发人员和管理人员。课程的主要内容是Oracle11g数据库性能调优的各种实例、方法、技巧以及与之对应的原理的讲解通过本课程地学习。学员可以大大的提升数据库性能调优的能力。课程结合大量案例,使学员能够理论结合实际,学以致用。课程目标←掌握Oracle11g数据库性能调优的各种实例、方法、技巧
讲师:孙增辉详情
oracle数据库性能优化 4天 12.08
Oracle数据库调优课程课时:4天1.课程适合对象Oracle数据库运维人员(DBA)2.培训所需实验设备及软件清单编号设备及软件名称对应课程1Oracle11g数据库课程安排上午(9:00-12:00)下午(14:00-17:00)第一天(1).Oracle数据库性能诊断工具•最根本的性能信息工具——数据库数据字典和动态性能视图•诊断性能定位问题工具:S
讲师:孙增辉详情
SAS 数据分析 从入门到精通 5天 12.08
SAS数据分析从入门到精通课程介绍SAS数据分析软件是应用最广泛的商业统计分析软件之一。本课程是从基础开始到专业应用的整体内容,帮助您理解数据分析的操作。课程目标SAS编程基础SAS常用函数及应用SAS数据集处理操作SAS宏编程SASPROCSQL描述统计T检验方差分析回归分析。培训对象数据库管理员、开发人员课程长度5天(30学时)培训方式案例分析、情景演练
讲师:孙增辉详情
Spark大数据分析 5天 12.08
Spark数据分析课程介绍本课程将关注spark的数据分析技术实际应用。课程目标数据分析培训对象开发人员课程长度5天(30学时)培训方式案例分析、情景演练课程内容第1天主题Spark的环境搭建与运行大纲Spark的本地安装与配置Spark集群Spark编程模型主题数据分析系统商业案例大纲个性化目标营销和客户细分预测建模与分析机器学习的系统架构第2天主题Spa
讲师:孙增辉详情
大数据与SAS数据挖掘4天 12.08
课程名称课程介绍本课程是大数据与使用sas做数据挖掘的基础课。主要内容是:1、介绍了大数据的定义。回顾大数据的时代背景、大数据的构成,已经大数据的“4v”特征。并且介绍了大数据的技术与应用范围。并介绍了大数据已经对我们产生的影响。以及一个广受欢迎的大数据支撑产品---hadoop软件的安装2、大数据是数据分析的前提,也是从数据中产生价值的基础。真正产生价值,
讲师:孙增辉详情
- [潘文富] 中小企业招聘广告的内容完
- [潘文富] 优化考核方式,减少员工抵
- [潘文富] 厂家心目中的理想化经销商
- [潘文富] 经销商的产品驱动与管理驱
- [潘文富] 消费行为的背后
- [王晓楠] 辅警转正方式,定向招录成为
- [王晓楠] 西安老师招聘要求,西安各区
- [王晓楠] 西安中小学教师薪资福利待遇
- [王晓楠] 什么是备案制教师?备案制教
- [王晓楠] 2024年陕西省及西安市最
- 1社会保障基础知识(ppt) 21149
- 2安全生产事故案例分析(ppt) 20176
- 3行政专员岗位职责 19034
- 4品管部岗位职责与任职要求 16208
- 5员工守则 15448
- 6软件验收报告 15383
- 7问卷调查表(范例) 15103
- 8工资发放明细表 14540
- 9文件签收单 14183