深圳网站制作公司 讯神马seo教程

web/2025/9/29 2:41:56/文章来源:
深圳网站制作公司 讯,神马seo教程,wordpress图书主题,宣传设计网站1.6 Spark作业提交原理 Spark作业#xff08;任务#xff09;提交就是使用spark中spark-sumbit命令将已经封装好成jar包的程序提交到spark集群中执行运行从而得到计算结果的过程#xff0c;在提交过程中我们对提交的作业#xff08;任务#xff09;进行参数设置操作 spa…1.6 Spark作业提交原理 Spark作业任务提交就是使用spark中spark-sumbit命令将已经封装好成jar包的程序提交到spark集群中执行运行从而得到计算结果的过程在提交过程中我们对提交的作业任务进行参数设置操作 spark提交作业的语法 bin/spark-submit \ --class main-class --master master-url \ ... # other options application-jar \ [application-arguments] 参数解释--classSpark程序中包含主函数的类--masterSpark程序运行的模式(环境)--deploy-modemaster设为为Yarn模式之后使用的模式client 和 cluster--driver-coresmaster设为为Yarn模式之后设置driver端的的cores个数--driver-memorymaster设为为Yarn模式之后用于设置driver进程的内存单位G或单位M--num-executorsmaster设为为Yarn模式之后用于设置Spark作业总共要用多少个Executor进程来执行--executor-memory指定每个executor可用内存单位G或单位M--total-executor-cores 2指定所有executor使用的cpu核数为2个--executor-cores指定每个executor使用的cpu核数application-jar打包好的应用jar包含依赖。这个URL在集群中全局可见。 比如hdfs:// 共享存储系统如果是file:// path那么所有的节点的path都包含同样的jarapplication-arguments传给main()方法的参数 1.6.1 spark提交作业方式Standalone模式 提交Spark提供的利用蒙特·卡罗算法求π的例子其中100这个参数是计算因子 spark-submit \ --class org.apache.spark.examples.SparkPi \ --master spark://qianfeng01:7077 \ --executor-memory 512m \ --total-executor-cores 2 \ /usr/local/spark-3.1.2/examples/jars/spark-examples_2.12-3.1.2.jar 100 注意:在启动任务的时候并没有指定分配资源,而是有多少资源就使用了多少资源我们在跑任务的时候是可以指定资源的,可以在指定使用核数和内存资源 1.6.2 spark提交作业方式YARN-client模式 提交Spark提供的利用蒙特·卡罗算法求π的例子其中100这个参数是计算因子 spark-submit \ --class org.apache.spark.examples.SparkPi \ --master yarn \ --deploy-mode client \ --driver-cores 1 \ --driver-memory 600M \ --executor-memory 800M \ --executor-cores 2 \ /usr/local/spark-3.1.2/examples/jars/spark-examples_2.12-3.1.2.jar 100 ​ #执行结果如下...... 2022-08-31 17:04:47,763 INFO scheduler.TaskSetManager: Finished task 99.0 in stage 0.0 (TID 99) in 20 ms on qianfeng02 (executor 2) (100/100) 2022-08-31 17:04:47,764 INFO cluster.YarnScheduler: Removed TaskSet 0.0, whose tasks have all completed, from pool 2022-08-31 17:04:47,766 INFO scheduler.DAGScheduler: ResultStage 0 (reduce at SparkPi.scala:38) finished in 1.464 s 2022-08-31 17:04:47,768 INFO scheduler.DAGScheduler: Job 0 is finished. Cancelling potential speculative or zombie tasks for this job 2022-08-31 17:04:47,768 INFO cluster.YarnScheduler: Killing all running tasks in stage 0: Stage finished 2022-08-31 17:04:47,779 INFO scheduler.DAGScheduler: Job 0 finished: reduce at SparkPi.scala:38, took 1.515996 s Pi is roughly 3.1420551142055113 2022-08-31 17:04:47,790 INFO server.AbstractConnector: Stopped Spark3c321bdb{HTTP/1.1, (http/1.1)}{0.0.0.0:4040} 2022-08-31 17:04:47,795 INFO ui.SparkUI: Stopped Spark web UI at http://qianfeng01:4040 ......注意:在启动任务的时候并没有指定分配资源,而是有多少资源就使用了多少资源我们在跑任务的时候是可以指定资源的,可以在指定使用核数和内存资源 1.6.3 spark提交作业方式YARN-Cluster模式 提交Spark提供的利用蒙特·卡罗算法求π的例子其中100这个参数是计算因子 spark-submit \ --class org.apache.spark.examples.SparkPi \ --master yarn \ --deploy-mode cluster \ --driver-cores 1 \ --driver-memory 600M \ --executor-memory 800M \ --executor-cores 2 \ /usr/local/spark-3.1.2/examples/jars/spark-examples_2.12-3.1.2.jar 100 #执行结果 在yarn集群的web ui中对应作业的日志的最底部能看到打印结果。 注意:在启动任务的时候并没有指定分配资源,而是有多少资源就使用了多少资源我们在跑任务的时候是可以指定资源的,可以在指定使用核数和内存资源 1.6.4 YARN-Cluster和YARN-Client的区别 理解YARN-Client和YARN-Cluster深层次的区别之前先清楚一个概念Application Master。在YARN中每个Application实例都有一个ApplicationMaster进程它是Application启动的第一个容器。它负责和ResourceManager打交道并请求资源获取资源之后告诉NodeManager为其启动Container。从深层次的含义讲YARN-Cluster和YARN-Client模式的区别其实就是ApplicationMaster进程的区别 YARN-Cluster模式下Driver运行在AM(Application Master)中它负责向YARN申请资源并监督作业的运行状况。当用户提交了作业之后就可以关掉Client作业会继续在YARN上运行因而YARN-Cluster模式不适合运行交互类型的作业 YARN-Client模式下Application Master仅仅向YARN请求ExecutorClient会和请求的Container通信来调度他们工作也就是说Client不能离开 总结 1Yarn-Cluster的Driver是在集群的某一台NM上但是Yarn-Client就是在Client的机器上 2Driver会和Executors进行通信所以Yarn_Cluster在提交App之后可以关闭Client而Yarn-Client不可以 3Yarn-Cluster适合生产环境Yarn-Client适合交互和调试。 Guff_hys_python数据结构,大数据开发学习,python实训项目-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/83648.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

后台风格网站湛江网站建设皆选小罗24专业

golangvue微服务电商系统 文章目录 golangvue微服务电商系统一、项目前置准备二、项目简介三、代码GItee地址 golang、vue redis、mysql、gin、nacos、es、kibana、jwt 一、项目前置准备 环境的搭建 官方go开发工程师参考地址:https://blog.csdn.net/qq23001186/cat…

网站建设价格差异多少wordpress月亮花园

文 | 水哥源 | 知乎Saying1. 小的性能差异在容易实现面前一文不值,这一点是XGBoost和LightGBM的最大优势2. 没能与embedding很好地结合无疑是树模型的灾难,吃不下巨量的新数据,也打不过DNN,除了一些规模比较小的公司,树…

织梦做中英文网站织梦通用seo网站模板

解锁Python装饰器的魔力:提升代码魅力的秘密武器 Python的装饰器(Decorators)是一种特殊的语法构造,它允许我们在不修改被装饰函数源代码的情况下,通过在其周围添加额外功能或行为。 装饰器本质上是一个函数&#xf…

茂名企业自助建站如何查网站关键词

静态类 继承(多态)、静态本身就是相反的。另外需要知道属性、事件其实是些特殊的方法。 使用 static 修饰符声明属于类型本身而不是属于特定对象的静态成员。 static 修饰符可用于类、字段、方法、属性、运算符、事件和构造函数,但不能用于索…

做单页网站需要做什么的公众号内容制作步骤

文章目录 Pickle模块简介Pickle模块的使用 最近从Github上下载了一个预训练好的Faster-RCNN模型用于科研任务,突然对该文件的格式,.pkl文件产生了一丝疑惑,便去特意了解了一下该格式的文件的含义,下面与大家共享。 Pickle模块简介…

wordpress开启子站上海哪家网站建设好

技术方案建议 使用RESTful API:采用RESTful API架构,实现与OpenAI服务的交互和数据传输。数据安全:确保用户数据的安全性和隐私保护,采用加密传输和安全认证机制。用户界面设计:设计直观友好的用户界面,提…

网站模版网 下载传统媒体网站建设

一、概述 1.1介绍 Hutool是一个小而全的Java工具类库,通过静态方法封装,降低相关API的学习成本,提高工作效率,使Java拥有函数式语言般的优雅,让Java语言也可以“甜甜的”。 Hutool中的工具方法来自于每个用户的精雕细…

青岛网站设计建立公司中国建行官方网站

1 为什么向AMSAT社区提及VPX / VNX 1.1VPX是包括卫星在内的最新一代军用车辆增长最快的标准 VITA 65 – 面向地面车辆的 OpenVPX文献检索将揭示在许多商业和军事坚固型系统应用中的广泛应用VITA 78 – AFRL和工业界正在开发用于卫星的“SpaceVPX”和“Space VPX Lite” 1.2 …

做网站需要的知识做网站公司哪个比较好

前段时间做一个小项目,为了同时存储多条数据,其中有一个功能是解析Excel并把其中的数据存入对应数据库中。花了两天时间,不过一天多是因为用了"upload"关键字作为URL从而导致总报同一个错,最后在同学的帮助下顺利解决&a…

长沙网站建设价中学生做的网站有哪些方面

awk的脚本套路是: awk的脚步部分最好用一对单引号将 ‘BEGIN{} /pattern1/{}…/patternN/{} END{}’ 套起来, 因为常用到$号, $号在单引号中不会被转义, 在双引号中有取值的含义 awk -F 自定义分隔符 BEGIN{开始块} /pattern1/{操作pattern1过滤的行的块} /pattern2/{操作patt…

番禺建设工程交易中心网站免费网站制作多少钱

目录 1 redo log(重做日志)2 undo log(回滚日志)3 Binlog(二进制日志)4 两阶段提交4.1 执行过程4.2 系统崩溃后重启如何刷新数据4.3 redo log 和 bin log区别 MySQL是一个关系型数据库管理系统,…

玩具网站规划说明书购物网站微信小程序注册方式

5 月 8 日,上海交通大学电子信息与电气工程学院(简称电院)与阿里巴巴集团宣布共同成立人工智能与系统联合实验室(后称“联合实验室”),并在上海交大闵行校区举行了揭牌仪式。 上海交大电院副院长王贺升教授…

个人公司网站建设千年之恋网页制作代码

3 存储 3.1 存储引擎 3、InnoDB 的四大特性? InnoDB 是 MySQL 数据库中最常用的存储引擎之一,它的四大特性通常指的是: ACID 兼容性: 原子性 (Atomicity): 保证事务内的操作要么全部成功,要么全部失败,不会出现中间状态。例如,银行转账操作,从一个账户向另一个账户转…

网站 什么语言开发网站 怎么做百度才能搜索出来

ipython开发环境搭建以及pandas快速入门0.开发环境搭建技巧网页版ipython:ipython notebooknumpy1.pandas 快速入门一导入创建对象2. pandas 快速入门二空数据处理apply的用法count和mode函数数据合并3. pandas 快速入门三数据整形数据透视时间序列数据可视化数据载…

用户体验较好的网站移动互联网开发课程设计选题

😆😆😆感谢大家的观看😆😆 🌹 reshape 函数 transpose 和 permute 函数 view 和 contigous 函数 squeeze 和 unsqueeze 函数 在搭建网络模型时,掌握对张量形状的操作是非常重要的&#xff…

wordpress博客网站描述在哪里贵州企业网站建设公司

从源码解析Kruise原地升级原理 本文从源码的角度分析 Kruise 原地升级相关功能的实现。 本篇Kruise版本为v1.5.2。 Kruise项目地址: https://github.com/openkruise/kruise 更多云原生、K8S相关文章请点击【专栏】查看! 原地升级的概念 当我们使用deployment等Wor…

做企业网站选百度云还是阿里云网站一定也做数据库吗

idea打开工程的时候包名叠在一起了 点击箭头处按钮,把第一第二行勾去掉 如下 最终效果

建立内部网站需要多少钱专业app开发

目录 专栏导读之前的课程1、小球类设计2、挡板类的设计3、砖块类4、砖块与小球的边界碰撞检测5、检测到碰撞,删除砖块,改变运动方向完整版代码总结 专栏导读 🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手 …

最牛的网站建设c#网站开发模板

文章目录 数据库的隔离级别和锁机制一、数据库隔离级别1. 隔离级别说明2. 如何选择隔离级别3. 查询当前客户端隔离级别的命令.4. 修改隔离的命令 二、数据库中的锁1. 共享锁、排他锁2. 死锁3. 行级锁、表级锁 三、解决更新丢失问题1. 解决方案2. 乐观锁、悲观锁3. 乐观锁、悲观…

注册域名去哪个网站好关于政协 网站建设

PID算法的通俗讲解 PID算法的江湖地位? PID算法在控制领域是非常常见的算法,小到控制温度,大到控制飞机的飞行姿态,基本上算是在控制领域万能的算法。 关于PID算法的生活小故事: 假设一辆慢点量的车,跑着跑…