SPARK高级课程
SPARK高级课程详细内容
SPARK高级课程
Spark培训
课程定位与课程目标
Spark是第一个脱胎于该转变的快速、通用分布式计算范式。Spark使用函数式编程范式
扩展了MapReduce模型以支持更多计算类型,可以涵盖广泛的工作流,这些工作流之前被
实现为Hadoop之上的特殊系统。Spark使用内存缓存来提升性能,因此进行交互式分析也
足够快速(就如同使用Python解释器,与集群进行交互一样)。缓存同时提升了迭代算法
的性能,这使得Spark非常适合数据理论任务,特别是机器学习。
本课程中,我们将首先讨论如何在本地机器上或者EC2的集群上设置Spark进行简单分析
。然后,我们在入门级水平探索Spark,了解Spark是什么以及它如何工作(希望可以激
发更多探索)。最后两节我们开始通过命令行与Spark进行交互,然后演示如何用Pytho
n写Spark应用,并作为Spark作业提交到集群上。
适用学员:从事无线建设、无线规划、无线覆盖的工管、网络建设、客户经理等部门员
工
课程设计:
|课程编号: |21090203016 |
|授课课时: |3至5天 |
|授课条件: |学员必须具有基本的JAVA编程知识 |
|内容摘要: | |
| |第一章 Spark大数据开放的技术相关 |
| |1.1 什么是Spark |
| |1.2 Spark与Hadoop的区别 |
| |1.3 Spark生态 |
| |Spark(内存计算框架) |
| |SparkSteaming(流式计算框架) |
| |Spark SQL(ad-hoc) |
| |Mllib(Machine Learning) |
| |GraphX(bagel将被取代) |
| |1.4 安装部署 |
| |Spark安装简介 |
| |Spark的源码编译 |
| |Spark Standalone安装 |
| |Spark Standalone HA安装 |
| |Spark应用程序部署工具spark-submit |
| | |
| |第二章 Spark运行架构和解析 |
| |2.1 Spark的运行架构 |
| |基本术语 |
| |运行架构 |
| |Spark on Standalone运行过程 |
| |Spark on YARN 运行过程 |
| |2.2 Spark运行实例解析 |
| |2.3 Spark on Standalone实例解析 |
| |2.4 Spark on YARN实例解析 |
| |小结 |
| | |
| |第三章 Spark调优 |
| |3.1 Spark生态系统概述 |
| |• 回顾Hadoop MapReduce |
| |• Spark运行模式 |
| |• RDD |
| |• Spark运行时模型简介 |
| |• 缓存策略介绍 |
| |• transformation |
| |• action |
| |• lineage |
| |• 容错处理 |
| |• 宽依赖与窄依赖 |
| |• 集群配置 |
| |3.2 Spark的监控 |
| |Spark UI监控 |
| |Ganglia 监控 |
| |3.3 Spark调优 |
| | |
| |第四章 Spark编程模型和解析 |
| |4.1 Spark的编程模型 |
| |Spark编程模型解析 |
| |RDD的特点、操作、依赖关系 |
| |Spark应用程序的配置 |
| |4.2 Spark编程实例解析 |
| |日志的处理 |
| |电信基站数据的处理 |
| |4.3 Spark的多语言编程 |
| |Spark的scala编程 |
| |Scala基本语法 |
| |Scala开发环境搭建 |
| |Scala开发Spark应用程序 |
| |4.4 Spark的Python编程 |
| |Python的基本语法 |
| |Pyhton开发Spark应用程序 |
| | |
| |第五章 Spark Streaming原理和实践 |
| |5.1 Spark Streaming原理 |
| |Spark流式处理架构 |
| |DStream的特点 |
| |Dstream的操作和RDD的区别 |
| |Spark Streaming的优化 |
| |5.2 Spark Streaming实例 |
| |文本实例 |
| |Window操作 |
| |网络数据处理 |
| | |
| |第六章 Spark SQL原理和实践 |
| |6.1 Spark SQL原理 |
| |Spark SQL的Catalyst优化器 |
| |Spark SQL内核 |
| |Spark SQL和Hive |
| |6.2 Spark SQL的实例和编程 |
| |Spark SQL的实例操作demo |
| |Spark SQL的编程 |
| | |
| |第七章 Spark源码研读 |
| |7.1 Spark源码研读 |
| |Spark源码下载和研读环境搭建 |
| |7.2 Spark Core介绍 |
| |SparkContext |
| |Executor |
| |Deploy |
| |7.3 RDD和Storage |
| |7.4 Scheduler和Task |
| |7.5 Spark Examples介绍 |
| | |
| |第八章 应用中的数据挖掘算法 |
| |8.1 Spark 机器学习入门 |
| |8.2 机器学习的原理 |
| |8.3 Mllib简介 |
| |8.4 Mllib的例程分析 |
| | |
| |第九章 大数据的zookeeper分布式 |
| |9.1 安装和配置详解 |
| |单机模式 |
| |配置文件介绍 |
| |9.2 BIN目录介绍及zookeeper的启动 |
| |9.3 集群模式 |
| |9.4 分布式队列与设计思路 |
| | |
| |第十章 应用服务器Jboss hadoop |
| |10.1 服务器软硬件配置 |
| |10.2 软件需求分析 |
| |10.3 Jboss服务器配置详解 |
| |10.4 Jboss部署配置文件 |
| |10.5 Jboss实例 |
|授课语言: |中文 |
骆飞老师的其它课程
互联网思维和语音IP化应用 02.03
互联网思维和语音IP化应用(课程大纲)“互联网已经改变了音乐、游戏、媒体、零售和金额行业,未来互联网精神将改变每一个行业,传统行业即使还想不出怎么去结合互联网,也一定要具备互联网思维。”(马化腾)互联网思维是零距离、网络化的经营管理思维。互联网思维下,企业管理需要以更加灵活的组织应对复杂的环境。张瑞敏说,互联网时代的管理没有标杆,企业只有自己去寻求适合的管理
讲师:骆飞详情
《5G移动通信技术和NB-FDD NB-IOT》 02.03
《5G移动通信技术发展方向及未来趋势分析》课程大纲【培训目标】5G移动通信技术作为目前最前沿的通信技术,是应2020年后通信技术发展需求而生的,目前该技术尚处于探索研究阶段。本课程从移动通信技术的发展历程展开分析,对5G移动通信技术的特点、优点及未来发展趋势等几方面出发进行概述,分析关键指标和技术,引领我国移动通信行业的新一轮变革。【培训对象】相关员工【培训
讲师:骆飞详情
5G技术与工程建设 02.03
《5G移动通信技术发展方向及未来趋势分析》课程大纲【培训目标】5G移动通信技术作为目前最前沿的通信技术,是应2020年后通信技术发展需求而生的,目前该技术尚处于探索研究阶段。本课程从移动通信技术的发展历程展开分析,对5G移动通信技术的特点、优点及未来发展趋势等几方面出发进行概述,分析关键指标和技术,引领我国移动通信行业的新一轮变革。【培训对象】相关员工【培训
讲师:骆飞详情
智慧家庭工程师 10.25
课程大纲:课程章节内容提要课程时间从概念到落地:智能家居与智慧家庭技术及应用概述智慧家庭/智能家居发展概述从数字化、信息化到智能化、智慧化概述未来城市及家庭的信息服务需求及趋势智能家居/智慧家庭概念模型规划设计基本建设思路解决方案总体架构描述应用+家庭云平台管+端互联网+信息通信+家庭生活传统电信运营的战略抉择(以中国电信为例)中国电信集团智慧家庭战略解读中
讲师:骆飞详情
智慧家庭认证工程师 10.25
智慧家庭认证工程师①培训目标在“智慧家庭”的这一战场上,各个运营商都卯足了劲,战术各不相同。中国移动押宝“和·家庭”计划并推出“魔百和”系列产品。中国电信成立智慧家庭产业联盟并发布产品“悦me”、全新智能宽带电视“天翼高清”,为用户提供家庭信息化服务综合解决方案;中国联通发布“智慧沃家”业务,满足家庭的智能化信息需求。本课程以智慧家庭建设目前存在的四大挑战为
讲师:骆飞详情
智慧家庭组网wifi PLC EOC POE 10.25
智慧家庭组网技术①培训目标本课程以电信运营商智慧家庭WLAN网络目前存在的四大挑战为切入点,重点介绍电信运营商电信级WLAN网络体系结构、核心平台以及标准技术体系、关键核心技术等内容,并进一步重点介绍WLAN网络规划方法、流程和重点工作,同时重点阐述WLAN网络优化基础技术与方法,WLAN重点优化内容以及实际案例。②大纲【培训对象】网优中心及地市公司WLAN
讲师:骆飞详情
云原生架构与Devops运维 10.25
云原生架构与Devops运维课程定位与课程目标互联网行业的火爆让“敏捷”和“DevOps”的管理理念成为IT项目管理的主流。“敏捷”是快速响应需求变化,及时交付阶段性产出,达到让客户满意的一种软件开发管理模式。“DevOps”理念更是超越了项目管理方面的范畴,它关注的是IT企业各部门角色能够更好的交流和协作的文化变革。课程通过大量真实的案例,纵向对比国外流行
讲师:骆飞详情
政企产品经理 解决方案能力提升 10.25
政企产品经理解决方案能力提升课程定位与课程目标2021年,世界飞速变化。以5G、大数据、云计算、人工智能为代表的新一轮科技革命和以数字化、信息化、智能化为标志的产业变革蓄势待发。新冠肺炎疫情的叠加影响,又使得数字经济的作用突显。后疫情时代,数字化转型将成为推动经济社会发展的新引擎。在新一轮数字化浪潮中,千行百业面临革新。作为中国领先的综合信息服务提供商,中国
讲师:骆飞详情
智慧城市交付项目管理 10.25
智慧城市交付项目管理课程定位与课程目标2014年称为中国的智慧城市建设元年,在这一重要的时间节点上,有必要对智慧城市概念、技术和发展进行一次全方位的梳理与总结。从技术的角度,对智慧城市的概念出现、发展现状、总体技术框架、核心关键技术、标准与评估体系、运营与应用模式等方面,进行尽可能详细和系统的阐述与介绍。希望能够为读者提供一个智慧城市技术发展的全景式概览。目
讲师:骆飞详情
云计算基础(三大运营商版) 10.25
云计算基础课程定位与课程目标云计算(cloudcomputing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。狭义云计算指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需资源;
讲师:骆飞详情
- [潘文富] 中小企业招聘广告的内容完
- [潘文富] 优化考核方式,减少员工抵
- [潘文富] 厂家心目中的理想化经销商
- [潘文富] 经销商的产品驱动与管理驱
- [潘文富] 消费行为的背后
- [王晓楠] 辅警转正方式,定向招录成为
- [王晓楠] 西安老师招聘要求,西安各区
- [王晓楠] 西安中小学教师薪资福利待遇
- [王晓楠] 什么是备案制教师?备案制教
- [王晓楠] 2024年陕西省及西安市最
- 1社会保障基础知识(ppt) 21151
- 2安全生产事故案例分析(ppt) 20191
- 3行政专员岗位职责 19036
- 4品管部岗位职责与任职要求 16210
- 5员工守则 15449
- 6软件验收报告 15385
- 7问卷调查表(范例) 15105
- 8工资发放明细表 14541
- 9文件签收单 14184