大数据技术及应用

  培训讲师:李海良

讲师背景:
李海良老师暨南大学副教授,硕士生导师,九三学社社员,中山大学工学博士香港城市大学访问学者广东工业大学校外合作研究生导师研究方向为深度学习、图像识别、智慧综合能源和能源大数据简介l2018年获得中山大学工学博士学位,2019年至2021年在暨 详细>>

李海良
    课程咨询电话:

大数据技术及应用详细内容

大数据技术及应用

《大数据技术及应用》课程教学大纲
一 、课程基本信息
课程名称
大数据技术及应用(英文名称) Big data technology and App lic
ation
课程学时
理论 8 小时,实验 4 小时
授课方式
多媒体+实践
考核方式
实践考试+课程论文
开课单位
先修课程
C 语言程序设计;Java 程序设计;数据结构;Linux 操作系统;
后续课程
大数据算法;
适用专业
数据科学与大数据技术、人工智能、模式识别与人工智能;信息
技术-职业技术教育方向
二 、课程的性质 、 目的和任务
《大数据技术及应用》 是大数据管理及应用专业人员一 门核心课程 ,也是 该专业的导入课程 ,以引导学生对数据科学与大数据技术与应用有一个全面和
概括性的了解。
通过本课程学习,使学生能较系统地掌握大数据的基本知识、原理和方法, 初步具备大数据的应用、开发的能力 ,为从事大数据分析、建模、可视化奠定 基础 。 目的是让学生了解并掌握四个领域即大数据系统的起源及系统特征;大 数据系统的架构设计及功能目标设计;大数据系统程序开发;企业大数据案例 分析的内容,同时利用真机实验环节以及大数据实训一体机来提升学生对大数
据开发的实践能力;
本课程重点让学生掌握三个方面的内容:
(1)基础篇: 主要包括 HDFS 使用操作、MapReduce 开发; 、HBase 数据库
的开发;
(2)核心篇: YARN 架构、Spark 集群计算;
(3)应用篇: 医药大数据案例分析。
三 、课程教学目标
(一)总体目标
掌握大数据分析的基本理论、技术, 了解大数据分析的典型应用场景、掌
握如何分析数据、解决问题、完成相关研究的方法 ,具有创新和独立思意识。
(二) 具体目标
通过本课程的学习 ,学生应达到如下目标:
1.知识与技能
(1) 了解大数据平台搭建的步骤,掌握大数据的存储、分析的原理;
(2) 了解大数据分析的典型应用场景,例如文本挖掘、Web 广告、聚类、
推荐系统、Web 链接分析、社交网络大数据分析、频繁项集;
(3) 理解大数据分析和挖掘的基本理论技术;
(4) 能获取、处理、分析和应用大数据资源。
2.过程与方法
(1)经过对大数据领域的探索,学会用大数据思维认识、分析和解决问题。
3.情感与态度
(1)通过探究活动,养成认真严谨的学习态度;
(2)通过师生、生生互动交流 ,体验大数据的价值和魅力。
四 、教学内容及教学基本要求
第一讲 大数据概述
(一)教学目的
通过本章的学习掌握大数据基本概念 ,理解大数据的处理流程, 了解大数
据在行业中的应用和未来趋势。
(二) 教学要求
1、解释大数据基本概念;
2、分析大数据的分析处理流程;
3、知道大数据技术应用场景和前景。
(三)教学内容
第一节大数据的概述知识要点: 大数据的定义和特征。
第二节大数据分析的过程、技术及工具知识要点: 大数据的采集、存储方
式、分析技术、展示及应用。
第三节大数据技术的发展前景知识要点: 大数据技术不断发展, 出现更多
的应用项目。
(四)教学重点与难点
1.教学重点: 大数据的基本概念。
2.教学难点: 大数据分析处理的流程。
第二讲 大数据集群系统基础
(一)教学目的
能分析大数据集群 , 阐明其基本原理; 在虚拟化计算机系统中安装
CentOS 7 操作系统 ,通过 SecureCRT/Xshell 访问 CentOS 7 操作系统 , 以 三台节点机搭建大数据集群环境。
(二)教学要求
1.掌握虚拟机软件 VMware Workstation 10 及以上和终端仿真程序 SecureCRT/Xshell 的下载、安装和使用方法;
2.掌握 VMware Workstation 10 中安装 CentOS 7 的方法;
3.理解大数据集群相关组成和技术 ,部署大数据集群。
(三)教学内容
第一节 CentOS 大数据集群系统的组成知识要点:CentOS 概念、CentOS 集群系统拓扑图。
第二节 操作实践:大数据集群的部署知识要点:集群规划、网络配置、 安全配置、时间同步、SSH 登录。
(四)教学重点与难点
1.教学重点:VMwareWorkstation、CentOS 7、SecureCRT 的安装和使 用。
2.教学难点: 大数据集群的部署。
第三讲 Hadoop 分布式系统
(一)教学目的
Hadoop 的使用需要搭建一个完整的分布式系统,在理解 Hadoop 工作原 理的基础上配置和运行 Hadoop。
(二)教学要求
1.说明 Hadoop 的运行原理。
2.掌握 Hadoop 环境的安装与配置。
(三)教学内容
第一节 Hadoop 相关技术及生态系统知识要点:构成 Hadoop 生态系统 的相关技术。
第二节 操作实践: Hadoop 安装与配置知识要点: JDK 安装、Hadoop 安装、Hadoop 运行、浏览 Hadoop 页面。
(四)教学重点与难点
1.教学重点:Hadoop 安装过程中 hadoop-en v.sh、yarn-en v.sh、slaves、 core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml 文件 的配置。
2.教学难点: Hadoop 安装过程中参数的配置。
第四讲 HDFS 分布式文件系统
(一)教学目的
Hadoop 采用分布式 HDFS,通过本章学习掌握 HDFS 的基本原理,掌握 HDFS
相关的操作命令,并能够应用 Java 对 HDFS 进行编程。(二) 教学要求
1 . 了解 HDFS 的特点、架构、数据读取过程、数据写入过程。
2. 掌握 HDFS 操作。
(三)教学内容
第一节 HDFS 知识要点: HDFS 设计前提和设计目标、Namenode 和 Datanode、文件系统的名字空间、数据复制、HDFS 读写流程。
第二节 HDFS 操作实践知识要点: HDFSShell、HDFS JavaAPI、Eclipse 开发环境、综合实例。
(四)教学重点与难点
1.教学重点: HDFS 的原理、数据读写的原理。
2.教学难点:HDFS 综合实例。
第五讲 分布式计算系统—MapReduce 及其应用实例
(一)教学目的
Hadoop 采用分布式计算系统 MapReduce,通过本章的学习,掌握 MapReduce 的基本原理、架构以及工作机制 ,并且掌握 MapReduce 的编程操作,从而运用 到实处。
(二)教学要求
1.分析 MapReduce 的基本原理、架构以及工作机制;
2.操作 MapReduce WordCount 编程和 MapReduce 倒排索引编程 ,实现其应 用。
(三)教学内容
第一节 MapReduce 简介知识要点: MapReduce 架构、原理、工作机制。
第二节 MapReduce 操作实践知识要点: MapReduceWordCount 编程实例、 MapReduce 倒排索引编程实例。
(四)教学重点与难点
1.教学重点: MapReduce 的基本原理、架构以及工作机制等知识内容。
2.教学难点:MapReduce WordCount 编程实例;MapReduce 倒排索引编程实 例
实践课 医药大数据案例分析
(一)教学目的
根据大数据系统的需求分析 ,在 Hadoop 框架下 ,基于 Hbase 数据库,综合 应用各项关键技术完成大数据系统的功能。
(二)教学要求
能在 Hadoop 框架下,综合大数据应用系统编程的原理、技术 ,呈现既定的 运行结果。
(三) 教学内容
第一节 项目概述知识要点: 医药电商大数据分析平台的形成背景。
第二节 功能需求知识要点:流量分析、经营状况分析、大数据可视化系统。 第三节 软件关键技术知识要点: 医药电商大数据分析平台的关键技术。
第四节 效果展示知识要点: 各类分析效果图。
第五节 系统构架设计知识要点:系统的组成、协作方式、网络拓扑、建设 方案。
第六节 数据存储设计知识要点:设计流量数据表、订单数据表、会员评价 表。
第七节 数据分析知识要点:采集、分析数据。第八节 数据展示知识要点: 结果数据展示代码。
(四)教学重点与难点
1.教学重点: 大数据系统的需求分析、Hbase 数据库的建立、程序的设计 与实现。
2.教学难点: 程序的设计与实现。
五 、各教学环节学时分配
章节
教学内容
各教学环节学时分配
合 计
讲 授
练 习
研 讨
在线
学习
课 外
其 它
第一讲
大数据概论
1
1
第二讲
大数据集群系统基础
1
1
第三讲
Hadoop 分布式系统
2
2
第四讲
HDFS 分布式文件系统
1
1
2
第五讲
MapReduce 分布式计算
1.5
0.5
2
第 6 讲
医药大数据案例分析
1
3
4
合计
12
六 、教学手段与方法
1.教学手段 :本课程主要采用多媒体、课件演示、实验实训等教学手段进行 教学。
2.教学方法 :本课程主要采用任务驱动、案例教学、讲授与讨论相结合等教 学方法进行教学 。课程内容主要按大数据处理任务进行组织 ,因此可以按解决 相应任务所需的方法技术进行教学组织和实践 。在课程的授课过程中 ,对于学 生难以理解的方法技术都给与案例分析,完整展现相应方法技术是如何实施和 应用的 。另外 ,课程教学过程中 ,可以围绕相关大数据处理的任务组织学生进 行讨论,培养学生主动学习、解决问题的能力。
七 、考核方式 、考核内容及成绩评定
1.考核评价方式
1)过程性考核评价方式。本课程的过程性考核评价方式主要包括:考勤、 作业、讨论、随堂提问等。
2)结果性考核评价方式。本课程的结果性考核评价方式主要是期末考查(开 卷)。根据各章知识点,设计期末考查试卷。
八 、课程教材
[1]朝乐门.数据科学[M].北京:清华大学出版社,2020.
[2]朝乐门.数据科学理论与实践[M].北京:清华大学出版社,2019.
[3]周苏,王文.大数据导论[M].清华大学出版社,2020 第一版
[4]许晶华.管理信息系统[M].广州:华南理工大学出版社,2015.
[5]黄梯云.管理信息系统[M].北京:高等教育出版社,2019.
[6]薛华成.管理信息系统[M].北京:清华大学出版社,2020.

 

李海良老师的其它课程

大语言模型开发与训练培训大纲第一天:基础知识与初步实践上午:理论基础与工具准备1.欢迎与介绍培训目标和内容概述参与者自我介绍与期望2.大语言模型概述2.1什么是大语言模型(LLM)定义与基本概念介绍Transformer架构及其在自然语言处理中的重要性2.2LLM的应用场景和优势介绍LLM在文本生成、翻译、问答系统、文本摘要等方面的应用主要的LLM架构GPT

 讲师:李海良详情


ZQBKAHoAdABYAGUAOQB2AEUAMgBVAGMAdgAyAHUANwA5AHYAbwBNAEEAegBhAFMAawBFAFoARAA2AFIAeAAwAHAAUwAyADMARABqAEoAUwBqAEgARQBiAEkAVQBBAGkAVwBiAFoASgBvAHMAdABpAGIAdQAwAEQAcQAzAFIAMwB5AC8AVQBx

 讲师:李海良详情


ZQBKAHoAdABYAGUAOQB2AEUAMgBVAGMAdgAyAHUANwA5AHYAbwBNAEEAegBhAFMAawBFAFoARAA2AFIAeAAwAHAAUwAyADMARABqAEoAUwBqAEgARQBiAEkAVQBBAGkAVwBiAFoASgBvAHMAdABpAGIAdQAwAEQAcQAzAFIAMwB5AC8AVQBx

 讲师:李海良详情


人工智能   08.29

人工智能课程大纲人工智能课程大纲一、课程介绍人工智能是现代科技领域的热点之一,本课程旨在介绍人工智能的基本理论、应用领域以及相关技术。通过本课程的学习,学生将了解人工智能的概念、发展历程以及未来发展趋势,掌握人工智能的基本原理和各种算法模型,并学会应用人工智能技术解决实际问题。二、课程目标1.理解人工智能的基本概念和原理;2.熟悉人工智能的发展历程和应用领域

 讲师:李海良详情


人工智能基础理论主题:机器学习,深度学习,大模型,多模态1.机器学习基础1.1机器学习的基本概念机器学习的定义与重要性数据驱动的方法与传统编程的区别1.2常见的机器学习算法及其应用场景线性回归:用于预测连续值逻辑回归:用于二分类问题决策树与随机森林:用于分类和回归支持向量机(SVM):用于分类问题2.深度学习基础2.1深度学习的基本原理人工神经网络的结构与工

 讲师:李海良详情


人工智能培训   08.29

第一天:人工智能基础理论主题:机器学习,深度学习,大模型,多模态1.机器学习基础1.1机器学习的基本概念机器学习的定义与重要性数据驱动的方法与传统编程的区别1.2常见的机器学习算法及其应用场景线性回归:用于预测连续值逻辑回归:用于二分类问题决策树与随机森林:用于分类和回归支持向量机(SVM):用于分类问题2.深度学习基础2.1深度学习的基本原理人工神经网络的

 讲师:李海良详情


软件工程设计   08.29

《软件工程设计》课程教学大纲总学时数:60学时,其中:理论教学30学时,实践教学30学时学分:先修课程:《计算机基础》,《C语言程序设计》,《数据结构》和《数据库原理及其应用》考核方式:考试一、制订大纲的依据本大纲根据2020年计算机应用技术专业教学计划制订二、课程简介软件工程作为一门专业主干课,重点要求学生学习与软件开发和维护有关的四个方面的主要内容——过

 讲师:李海良详情


网络安全渗透测试培训大纲---培训目标:本培训旨在通过五天的学习,使学员全面掌握网络安全渗透测试的理论知识与实践技能。培训将理论与实践相结合,确保学员能够在理解渗透测试原理的基础上,熟练运用各种工具和技术进行实际操作。通过培训,学员将能够独立完成渗透测试项目,提升网络安全防护与应急响应能力。---第一天:渗透测试基础与理论上午-网络安全概述-网络安全的重要性

 讲师:李海良详情


业务数字化方法论课程背景:一方面,随着信息化的深入,在传统IT建设方式下,企业独立采购或者自建的各种企业信息系统,在内部数据无法互通,难以配合业务数字化的快速发展;另一方面,云服务的出现,让硬件基础设施转向成数据云策略,让IT架构更灵活,但这也让互联互通困扰企业发展。数据中台和业务中台是企业数字化转型的必然产物。中台架构作为整个企业各个业务所需数据服务的提供

 讲师:李海良详情


深度学习框架技术培训课程大纲第一天:深度学习基础与框架概述上午:深度学习入门深度学习历史与基本原理神经网络基础:感知机、多层前馈网络激活函数与损失函数介绍反向传播算法原理深度学习框架重要性为什么需要深度学习框架主流深度学习框架概览(TensorFlow,PyTorch,Keras,MXNet等)框架选择考量因素下午:TensorFlow框架基础TensorF

 讲师:李海良详情


COPYRIGT @ 2001-2018 HTTP://WWW.QG68.CN INC. ALL RIGHTS RESERVED. 管理资源网 版权所有