Spark任务调度流程详解

Spark任务调度流程详解

diannao/2025/11/5 15:09:20/文章来源:https://blog.csdn.net/2303_79480422/article/details/147873485

1. 核心调度组件

DAGScheduler：负责将Job拆分为Stage，处理Stage间的依赖关系。
TaskScheduler：将Task分配到Executor，监控任务执行。
SchedulerBackend：与集群管理器（如YARN、K8s）通信，管理Executor资源。

2. 调度流程分步拆解

步骤1：用户提交代码

val rdd = sc.textFile("hdfs://data.txt").flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _)
rdd.collect()  // 触发Job提交

步骤2：生成DAG（有向无环图）

RDD血缘（Lineage）：记录RDD的转换过程（textFile → flatMap → map → reduceByKey）。
宽依赖（Shuffle）：reduceByKey导致Stage划分。

步骤3：划分Stage

Stage 0：textFile → flatMap → map（窄依赖，合并为一个Stage）。
Stage 1：reduceByKey（宽依赖，单独一个Stage）。

步骤4：提交Task

Stage 0生成多个MapTask，Stage 1生成多个ReduceTask。
TaskScheduler根据数据本地性（Data Locality）分配Task到Executor。

步骤5：执行与监控

Executor执行Task，向Driver汇报状态。
失败Task自动重试（默认重试3次）。

3. 关键概念详解

概念	说明	示例
Job	由行动操作（如`collect`）触发的完整计算任务	一次`collect()`生成一个Job
Stage	由一组无Shuffle依赖的Task组成（分为`ResultStage`和`ShuffleMapStage`）	`reduceByKey`前为一个Stage
Task	Stage中每个分区的计算单元（`ShuffleMapTask`或`ResultTask`）	处理一个分区的数据
Shuffle	跨Stage数据重分布（如`groupByKey`、`join`）	`reduceByKey`触发Shuffle
数据本地性	优先将Task调度到数据所在节点（`PROCESS_LOCAL` > `NODE_LOCAL` > `ANY`）	读取HDFS块时优先分配到数据所在节点

4. 调度流程示意图

5. 性能优化点

减少Shuffle：
- 用reduceByKey替代groupByKey（提前局部聚合）。
- 使用Broadcast Join代替Shuffle Join。
调整并行度：
- 通过spark.default.parallelism或repartition()控制分区数。
数据本地性：
- 确保输入数据与Executor在同一节点（如HDFS副本策略）。
资源分配：
- 合理设置Executor内存（spark.executor.memory）和CPU核心数（spark.executor.cores）。

6. 容错机制

Stage重试：若某个Stage失败，重新提交该Stage的所有Task。
Task重试：单个Task失败后，TaskScheduler会重新调度（默认最多3次）。
血缘恢复：若Executor丢失数据，根据RDD血缘重新计算。

总结

Spark的调度机制通过DAG优化、本地性优先和容错设计，实现了高效的大数据处理。理解其原理后，可通过调整分区策略、优化Shuffle操作等手段显著提升性能。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/diannao/82650.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

第04章—技术突击篇：如何根据求职意向进行快速提升与复盘

第04章—技术突击篇：如何根据求职意向进行快速提升与复盘

经过上一讲的内容阐述后，咱们定好了一个与自身最匹配的期望薪资，接着又该如何准备呢？ 很多人在准备时，通常会选择背面试八股文，这种做法效率的确很高，毕竟能在“八股文”上出现的题，也绝对是面…

阅读更多...

Go语言的逃逸分析是怎么进行的

Go语言的逃逸分析是怎么进行的

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。非常期待和您一起在这个小…

阅读更多...

ARM 芯片上移植 Ubuntu 操作系统详细步骤

ARM 芯片上移植 Ubuntu 操作系统详细步骤

一、准备工作 （一）硬件准备 ARM 开发板：确保 ARM 开发板的型号与 Ubuntu 官方支持的 ARM 架构兼容，常见的 ARM 架构有 ARMv7、ARMv8 等。例如树莓派系列开发板，广泛用于 ARM 系统移植，其采用 ARM 架构。存…

阅读更多...

两台服务器之前共享文件夹

两台服务器之前共享文件夹

本文环境服务器A:ubuntu24.22系统 IP:10.0.8.1 服务器B:ubuntu24.22系统 IP:10.0.8.10 本操作旨在将服务器B的/opt/files目录共享给服务器A得/opt/files 在 B 服务器上设置共享安装 NFS 服务： sudo apt -y install nfs-kernel-server编辑/etc/exports文件&…

阅读更多...

超市销售管理系统 - 需求分析阶段报告

超市销售管理系统 - 需求分析阶段报告

1. 系统概述超市销售管理系统是为中小型超市设计的信息化管理解决方案，旨在通过信息化手段实现商品管理、销售处理、库存管理、会员管理等核心业务流程的数字化，提高超市运营效率和服务质量，同时为管理者提供决策支持数据。 2. 业务需求分…

阅读更多...

GPIO控制

GPIO控制

GPIO是General Purpose I/O的缩写，即通用输入输出端口，简单来说就是MCU/CPU可控制的引脚， 这些引脚通常有多种功能，最基本的是高低电平输入检测和输出，部分引脚还会与主控器的片上外设绑定， 如作为串口、I2…

阅读更多...

Docker 部署Nexus仓库搭建Maven私服仓库公司内部仓库

Docker 部署Nexus仓库搭建Maven私服仓库公司内部仓库

介绍 Nexus 是广泛使用的仓库管理工具，常用于管理 Java 构件（如 JAR、WAR、EAR 文件）。它可以作为一个本地的 Maven 仓库，用来存储和管理项目的依赖包和构建产物。支持多种仓库类型，能够帮助开发团队更高效地管理构件…

阅读更多...

Android 13 默认打开使用屏幕键盘

Android 13 默认打开使用屏幕键盘

原生设置里，系统-语言和输入法-实体键盘-使用屏幕键盘选项， 关闭时，外接物理键盘，如USB键盘，输入时不会弹出软键盘。打开时，外接物理键盘，如USB键盘，输入时会弹出软键盘。这个选…

阅读更多...

关于ubuntu下交叉编译arrch64下的gtsam报错问题，boost中boost_regex.so中连接libicui18n.so.55报错的问题

关于ubuntu下交叉编译arrch64下的gtsam报错问题，boost中boost_regex.so中连接libicui18n.so.55报错的问题

交叉编译gtsam时遇到的报错信息如下：gtsam需要连接boost， 解决办法： 1.重新编译boost可解决。 2.自己搞定生成一个libicui18n.so.55。由于我们的boost是公用的，因此1不太可能（我试过重新编译完boost,在编译gtsam完…

阅读更多...

android-ndk开发(9): undefined reference to `__aarch64_ldadd4_acq_rel` 报错分析

android-ndk开发(9): undefined reference to `__aarch64_ldadd4_acq_rel` 报错分析

1. 概要基础库 libbase.a 基于 android ndk r18b 编译， 被算法库 libfoo.so 和算法库 libbar.a 依赖， 算法库则分别被 libapp1.so 和 libapp2.so 依赖。 libapp1.so 的开发者向 libfoo.so 的开发者反馈了链接报错： error: undefined symb…

阅读更多...

如何清除windows 远程桌面连接的IP记录

如何清除windows 远程桌面连接的IP记录

问题在远程桌面连接后，会在输入列表留下历史IP记录，无用的IP多了会影响我们查找效率，也不安全。现介绍如何手动删除这些IP记录。解决方案 1、打开注册表按 Win R，输入 regedit，回车定位到远程桌面记录的注册表…

阅读更多...

使用 React Native实现鸿蒙开发的详细方案

使用 React Native实现鸿蒙开发的详细方案

一、环境准备 1. 基础环境要求操作系统：Windows 10/11 或 macOS (建议版本最新)Node.js: v16.x 或更高版本npm: v8.x 或更高版本Java JDK: 11 或更高版本DevEco Studio: 3.1 或更高版本 (鸿蒙官方IDE)2. 安装 DevEco Studio 从华为开发者官网下载安装时选择以下组件： Harmo…

阅读更多...

贪心算法应用：顶点覆盖问题详解

贪心算法应用：顶点覆盖问题详解

贪心算法应用：顶点覆盖问题详解贪心算法是解决顶点覆盖问题的经典方法之一。下面我将从基础概念到高级优化，全面详细地讲解顶点覆盖问题及其贪心算法解决方案。一、顶点覆盖问题基础 1. 问题定义顶点覆盖问题（Vertex Cover Problem&am…

阅读更多...

Excel安全防护：开源批量加密工具推荐与使用指南

Excel安全防护：开源批量加密工具推荐与使用指南

先放下载链接：https://tool.nineya.com/s/1iqsn2sh0 在日常办公里，像财务数据、客户信息、项目报表这类核心资料，常常是以 Excel 文件的形式来存储的。要是手动一个一个地给这些文件加密，那可太费时间和精力了，而且还…

阅读更多...

【C++】学习、项目时Debug总结

【C++】学习、项目时Debug总结

这里写目录标题 1. 内存问题1.1. 内存泄漏1.1.1. 内存泄漏案例检查方法1.1.2. 主线程提前退出导致【控】1.1.3. PostThreadMessage失败导致的内存泄漏**【控】**1.1.4. SendMessage 时关闭客户端【控】1.1.5. 线程机制导致【**控】**1.1.6. exit（0）导致【…

阅读更多...

2025 后端自学UNIAPP【项目实战：旅游项目】1、创建项目框架

2025 后端自学UNIAPP【项目实战：旅游项目】1、创建项目框架

1、创建项目 ①项目名称：自定义，【我是travel】 ②vue版本：vue3 ③其他默认，最后创建 2、创建页面 ①展开自己刚才创建的项目 ②单击选中pages文件夹 --->鼠标右键---->新建页面 ③页面名称：自定义favouri…

阅读更多...

WPF 子界面修改后通知到主页面

WPF 子界面修改后通知到主页面

子页面： public partial class MyPopupWindow : Window { public event Action OnClose; private void CloseWindowButton_Click(object sender, RoutedEventArgs e) { OnClose?.Invoke(); this.Close(); } } 主界面&#xff1a…

阅读更多...

Python中的标识、相等性与别名：深入理解对象引用机制

Python中的标识、相等性与别名：深入理解对象引用机制

在Python编程中，理解变量如何引用对象以及对象之间的比较方式是至关重要的基础概念。本文将通过Lewis Carroll的笔名示例，深入探讨Python中的对象标识、相等性判断以及别名机制。别名现象：变量共享同一对象 >>> charles {name: …

阅读更多...

python 闭包获取循环数据经典 bug

python 闭包获取循环数据经典 bug

问题代码 def create_functions():functions []for i in range(3):# 创建一个函数,期望捕获当前循环的i值functions.append(lambda: print(f"My value is: {i}"))return functions# 创建三个函数 f0, f1, f2 create_functions()# 调用这些函数 f0() # 期望输出 &…

阅读更多...

克里金模型+多目标优化+多属性决策！Kriging+NSGAII+熵权TOPSIS！

克里金模型+多目标优化+多属性决策！Kriging+NSGAII+熵权TOPSIS！

目录效果一览基本介绍程序设计参考资料效果一览基本介绍克里金模型多目标优化多属性决策！KrigingNSGAII熵权TOPSIS！！matlab2023b语言运行！ 1.克里金模型（Kriging Model）是一种基于空间统计学的插值方法…

阅读更多...

最新文章