欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 游戏 > 尚硅谷大数据技术Spark2024新版教程-笔记01【Spark概述、Spark运行模式】

尚硅谷大数据技术Spark2024新版教程-笔记01【Spark概述、Spark运行模式】

2025/5/11 22:34:26 来源:https://blog.csdn.net/weixin_44949135/article/details/140324822  浏览:    关键词:尚硅谷大数据技术Spark2024新版教程-笔记01【Spark概述、Spark运行模式】

视频地址:尚硅谷2024新版本Spark教程,一套搞定大数据Spark3.x!_哔哩哔哩_bilibili

  1. 尚硅谷大数据技术Spark2024新版教程-笔记01【】
  2. 尚硅谷大数据技术Spark2024新版教程-笔记02【】
  3. 尚硅谷大数据技术Spark2024新版教程-笔记03【】
  4. 尚硅谷大数据技术Spark2024新版教程-笔记04【】
  5. 尚硅谷大数据技术Spark2024新版教程-笔记05【】
  6. 尚硅谷大数据技术Spark2024新版教程-笔记06【】
  7. 尚硅谷大数据技术Spark2024新版教程-笔记07【】

目录

01_尚硅谷大数据技术之Spark入门(V5.0)

P001【001 - Spark - 课程介绍】02:04

P002【002 - Spark - 文件结构 - 介绍】02:10

P003【003 - Spark - 基础概念 - 介绍 - 分布式】07:02

P004【004 - Spark - 基础概念 - 介绍 - 计算】12:04

P005【005 - Spark - 基础概念 - 介绍 - 分布式基础架构】08:14

P006【006 - Spark - 基础概念 - 介绍 - 框架】12:21

P007【007 - Spark - 基础概念 - 介绍 - Spark和MR的关系】18:30

第1章 Spark概述

P008【008 - Spark - 介绍】11:51

第2章 Spark运行模式

P009【009 - Spark - 部署方式 - 介绍】13:24

P010【010 - Spark - 解压后的文件结构】07:58

P011【011 - Spark - 部署环境 - Local】09:15

P012【012 - Spark - 部署环境 - Local - 演示】20:41

P013【013 - Spark - 部署环境 - Yarn - 演示】19:30

P014【014 - Spark - 部署环境 - Yarn - 历史服务】06:50

P015【015 - Spark - 部署环境 - Yarn - 2种执行方式Cluster和Client】17:50

P016【016 - Spark - 部署环境 - 几种模式的对比】07:02


01_尚硅谷大数据技术之Spark入门(V5.0)

P001【001 - Spark - 课程介绍】02:04

本套教程基于Spark 3.3版本,力求让学习者对分布式计算的原理、框架的使用建立深刻的理解,从而将Spark应用于企业的项目中。

Apache Spark 版本(version):3.3.1

基于 Java 和 Scala 开发的作为大规模数据处理快速通用的分布式计算引擎。

 

P002【002 - Spark - 文件结构 - 介绍】02:10

P003【003 - Spark - 基础概念 - 介绍 - 分布式】07:02

  1. Spark:分布式计算引擎(框架),基于 MR 开发的,
  2. HDFS:分布式存储
  3. Kafka:分布式消息传输
  4. MR:分布式计算

抢占CPU的操作由进程来完成,执行是执行线程。

P004【004 - Spark - 基础概念 - 介绍 - 计算】12:04

P005【005 - Spark - 基础概念 - 介绍 - 分布式基础架构】08:14

P006【006 - Spark - 基础概念 - 介绍 - 框架】12:21

P007【007 - Spark - 基础概念 - 介绍 - Spark和MR的关系】18:30

第1章 Spark概述

P008【008 - Spark - 介绍】11:51

回顾:Hadoop主要解决,海量数据的存储和海量数据的分析计算。

Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎

第2章 Spark运行模式

P009【009 - Spark - 部署方式 - 介绍】13:24

部署Spark集群大体上分为两种模式:单机模式与集群模式

大多数分布式框架都支持单机模式,方便开发者调试框架的运行环境。但是在生产环境中,并不会使用单机模式。因此,后续直接按照集群模式部署Spark集群。

下面详细列举了Spark目前支持的部署模式。

(1)Local模式:在本地部署单个Spark服务

(2)Standalone模式:Spark自带的任务调度模式。(国内不常用)

(3)YARN模式:Spark使用Hadoop的YARN组件进行资源与任务调度。(国内最常用)

(4)Mesos模式:Spark使用Mesos平台进行资源与任务的调度。(国内很少用)

P010【010 - Spark - 解压后的文件结构】07:58

P011【011 - Spark - 部署环境 - Local】09:15

P012【012 - Spark - 部署环境 - Local - 演示】20:41

P013【013 - Spark - 部署环境 - Yarn - 演示】19:30

P014【014 - Spark - 部署环境 - Yarn - 历史服务】06:50

P015【015 - Spark - 部署环境 - Yarn - 2种执行方式Cluster和Client】17:50

P016【016 - Spark - 部署环境 - 几种模式的对比】07:02

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词