【spark-submit】--提交任务

Spark-submit

spark-submit 是 Apache Spark 提供的用于提交 Spark 应用程序到集群的命令行工具。

基本语法

spark-submit [options] <app-jar> [app-arguments]

常用参数说明

应用程序配置

--class <class-name>: 指定应用程序的主类（对于 Java/Scala 程序）
--name <app-name>: 设置应用程序名称
--jars <jars>: 添加额外的 JAR 文件到 classpath（逗号分隔）
--py-files <files>: 为 Python 应用添加额外的文件（.zip, .egg, .py）
--files <files>: 将文件上传到执行器工作目录（逗号分隔）
--conf <key>=<value>: 设置任意 Spark 配置属性

资源分配

--driver-memory <memory>: 设置 Driver 进程内存（如 1g）
--executor-memory <memory>: 设置每个 Executor 进程内存（如 1g）
--executor-cores <num>: 设置每个 Executor 使用的核心数
--num-executors <num>: 设置要启动的 Executor 数量
--total-executor-cores <num>: 设置所有 Executor 使用的总核心数

部署模式

--master <master-url>: 指定集群管理器
- local: 本地模式（单线程）
- local[K]: 本地模式（K 个线程）
- local[*]: 本地模式（使用所有核心）
- spark://host:port: 连接到独立部署的 Spark 集群
- mesos://host:port: 连接到 Mesos 集群
- yarn: 连接到 YARN 集群
- k8s://https://host:port: 连接到 Kubernetes 集群
--deploy-mode <mode>: 部署模式（client 或 cluster）
- client: Driver 在提交的客户端运行（默认）
- cluster: Driver 在集群中运行

其他参数

--verbose: 打印调试信息
--version: 打印 Spark 版本
--help: 显示帮助信息
--supervise: 如果失败则自动重启 Driver（仅限独立集群）
--kill <submissionId>: 终止指定应用程序
--status <submissionId>: 查询指定应用程序状态

使用示例

spark-submit --master yarn \
--deploy-mode client \
--driver-memory xG \
--executor-memory XG \
--class org.xx.xx \
--executor-cores x \
jar包
arg0 arg1

基本示例

# 本地运行（4个线程）
spark-submit --class org.apache.spark.examples.SparkPi \--master local[4] \/path/to/examples.jar \100# YARN 集群模式
spark-submit --class org.apache.spark.examples.SparkPi \--master yarn \--deploy-mode cluster \--executor-memory 2g \--num-executors 10 \/path/to/examples.jar \100

Python 应用示例

spark-submit --master spark://master:7077 \--executor-memory 1g \--py-files dependencies.zip \my_python_app.py \arg1 arg2

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/900893.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

【spark-submit】--提交任务

Spark-submit

基本语法

常用参数说明

应用程序配置

资源分配

部署模式

其他参数

使用示例

基本示例

Python 应用示例

相关文章

2025.4.10总结

SvelteKit 最新中文文档教程（18）—— 浅层路由和 Packaging

Winform入门进阶企业级开发示例：http接口数据清洗转换、断线续传、mqtt数据传输实例详解(附代码资源下载)

Python代码缩进统一规范

asp.net core 项目发布到 IIS 服务器

spring mvc中不同服务调用类型（声明式（Feign）、基于模板（RestTemplate）、基于 SDK、消息队列、gRPC）对比详解

CVE-2025-29927 Next.js 中间件鉴权绕过漏洞

WP最主题专业的wordpress主题开发

玩转代理 IP ：实战爬虫案例

Vue 3 中 ref 与 reactive 的对比

《Vue.js组件化开发实战：从安全纵深到性能跃迁》

从0到1的Python接口自动化学习路线

HDCP（五）

国标GB28181协议EasyCVR视频融合平台：5G时代远程监控赋能通信基站安全管理

A2L文件解析

光学工程考研调剂推荐

SQLite 注入：深入理解与防范策略

汽车与航空航天领域软件维护：深度剖析与未来展望

Jupyter notebook使用技巧

车辆视频检测器linux版对于密码中包含敏感字符的处理方法