房子装修网站上海人才招聘哪个网站好

news/2025/9/23 22:08:44/文章来源:
房子装修网站,上海人才招聘哪个网站好,教育网站案例,wordpress导航页面样式1.Kafka的数据存储形式 一个主题由多个分区组成 一个分区由多个segment段组成 一个segment段由多个文件组成#xff08;log#xff0c;index#xff08;稀疏索引#xff09;#xff0c;timeindex#xff08;根据时间做的索引#xff09;#xff09; 2.读数据的流程 …1.Kafka的数据存储形式 一个主题由多个分区组成 一个分区由多个segment段组成 一个segment段由多个文件组成logindex稀疏索引timeindex根据时间做的索引 2.读数据的流程 消费者的offset是一个针对分区的全局offset 可以根据这个offset找到segment段 接着需要将全局offset转换成segment的局部offset 根据局部offset就可以从.index稀疏索引找到对应的数据位置 开始顺序读取 3.Oozie的概念 Oozie是用来管理Hadoop生态圈Job的工作流调度系统运行于Java Servlet容器上的一个Java Web应用Oozie是按照DAG有向无环图的顺序调度一系列的Map/Reduce或者Hive等任务。Oozie由hPDLHadoop Process Definition Language定义XML格式的语言。使用场景包括需要按照顺序进行一系列任务并行处理的任务定时和周期触发的任务可视化作业流运行过程运行结果或异常的通报。 4.Oozie的架构 Oozie Client提供命令行CLIJava APIrest等方式对Oozie的工作流流程的提交启动运行等操作。 Oozie WebOozie Server本质是一个Java应用可以使用内置的Web容器也可以使用外置的Web容器。 Hadoop Cluster底层执行Oozie编排流程的各个Hadoop生态圈组件。 Oozie各种任务的提交底层都是依赖于MR程序。 5.Oozie的基本原理 Oozie对于工作流的编排是基于workflow.xml文件来完成的。用于预先将工作流执行规则定制于workflow.xml文件中并在job.properties配置相关的参数然后由Oozie Server向MR提交job来启动工作流。 流程节点 ControlFlowNodes控制工作流执行路径包括startendkilldecisionforkjoin。 Action Nodes决定每个操作执行的任务类型包括MapReduceJavahiveshell等。 举例 6.Oozie工作流类型 1WorkFlow规则相对简单不涉及定时批处理的工作流。顺序执行节点 缺点没有定时和条件触发功能。 2Coordinator Coordinator将多个工作流Job组织起来成为Coordinator Job并制定触发时间和频率还可以配置数据集并发数等类似于在工作流外部增加了一个协调器来管理这些工作流的工作流Job的运行。 3Bundle 针对coordinator的批处理工作流。Bundle将多个coordinator管理起来这样我们只需要一个Bundle提交即可。 6.Oozie官方自带了许多案例里面封装了各种类型任务的配置模板 所以后续可以根据官方给的这些配置模板进行修改就好。 7.感觉很多中间件的使用就是配置好配置文件即可。在使用层面组件帮我们做了很多事 8.Oozie调度流程 1根据官方自带的示例编写配置文件 job.properties  workflow.xml 2把任务配置信息连同依赖的资源一起上传到hdfs指定的路径这个路径在配置中有 3利用Oozie的命令进行提交 9.Oozie任务串联 在实际工作中肯定会存在多个任务需要执行并且存在上一个任务的输出的结果作为下一个任务的输入数据这样的情况所以我们需要在workflow.xml配置文件当中配置多个action实现多个任务之间的相互依赖关系。 比如先执行一个shell脚本执行完了之后再执行一个MR的程序最后再执行一个hive程序。 其实就是依靠workflow.xml配置文件来控制好节点的流程。 10.Oozie定时调度 主要是通过coordinator来实现任务的定时调度Coordinator模块主要通过xml来配置即可。 有两种调度方式1基于时间的定时任务调度2基于数据的任务调度。 11.Hue集成Oozie 背景Oozie本身的开发不是很友好不论是调度Hive程序还是调度MapReduce程序都要编写大量的配置文件然后做上传提交再执行比较麻烦。 Hue可以实现鼠标拖拽的办法来实现Oozie所支持的所有功能。 ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ Flink 12.Flink支持所有的流式计算 13.Flink的发展 第 1 代Hadoop MapReduc 批处理 Mapper、Reducer 2 第 2 代DAG 框架Oozie 、TezTez MapReduce 批处理 1 个 Tez MR(1) MR(2) ... MR(n) 相比 MR 效率有所提升 第 3 代Spark 批处理、流处理、SQL 高层 API 支持 自带 DAG 内存迭代计算、性能较之前大幅提 第 4 代Flink 批处理、流处理、SQL 高层 API 支持 自带 DAG 流式计算性能更高、可靠性更高。 14.什么是Flink Apache Flink 是一个框架和分布式处理引擎用于对无界和有界数据流进行有状态计算。Flink 被设计在所有常见的集群环境中运行以内存执行速度和任意规模来执行计算。 15.什么是批处理和流处理 批处理的特点是有界、持久、大量批处理非常适合需要访问全套记录才能完成的计算工作一般用于离线统计。流处理的特点是无界、实时流处理方式无需针对整个数据集执行操作而是对通过系统传输的每个数据项执行操作一般用于实时统计。 在 Spark 生态体系中对于批处理和流处理采用了不同的技术框架批处理由 SparkSQL 实现流处理由 Spark Streaming 实现这也是大部分框架采用的策略使用独立的处理器实现批处理和流处理而 Flink 可以同时实现批处理和流处理。 Flink 是如何同时实现批处理与流处理的呢答案是Flink 将批处理即处理有限的静态数据视作一种特殊的流处理。 上图为 Flink 技术栈的核心组成部分值得一提的是Flink 分别提供了面向流式处理的接口DataStream API和面向批处理的接口DataSet API。因此Flink 既可以完成流处理也可以完成批处理。Flink 支持的拓展库涉及机器学习FlinkML、复杂事件处理CEP、以及图计算Gelly还有分别针对流处理和批处理的 Table API。 16.Flink的四种运行模式 1local模式 原理在本地模拟多线程去模拟Flink中的各个角色。 2StandAlone独立集群模式 原理 3Standalone-HA高可用集群模式 原理 前面的架构中存在Job Manager有单点故障的风险Job Manager担任任务调度和资源分配它出现故障很危险。因此。 4Flink-On-Yarn 原理 为什么使用flink on yarn a.公司资源有限大多数有Hadoop系统节约资源 b.yarnd的资源可以按需使用提高集群的资源利用率 c.yarn的任务有优先级根据优先级运行作业 d.基于yarn调度系统能够自动化的处理各个角色的failover容错 d.1 JobManager进程和TaskManagerj进程都由Yarn NodeManager 监控 d.2 如果JobManager进程异常退出则Yarn RecourseManager 会重新调度JobManager到其他机器 d.3 如果TaskManager 进程异常退出JobManager 会收到消息并重新向Yarn RecourseManager 申请资源重新启动TaskManager。 16.Flink on yarn的两种模式 1Session模式Session会话模式在Yarn集群中启动了一个Flink集群并重复使用该集群 特点需要事先申请资源启动JobManager和TaskManager 优点不需要每次提交作业申请资源而是使用已经申请好的资源,从而提高执行效率 缺点作业执行完之后资源不会被释放因此会一直占用系统资源 应用场景适合作业提交比较频繁的场景小作业比较多的场景 2Per-Job模式Job分离模式用的多针对每个Flink任务都去启动一个独立的Flink集群用完就关不能重复使用该集群 特点每次提交作业都需要申请一次资源 优点作业运行完成资源会立即释放,不会一直占用系统资源 缺点每次提交作业都需要申请资源会影响执行效率因为申请资源需要消耗时间 应用场景适合作业比较少大作业的场景。 17.Flink应用程序的编程模型 eg 18.Flink中应用编程使用DataStream API弃用DataSet API。 注意在Flink1.12中DataSteam既支持流处理也支持批处理。在后续开发中把一切的数据源看作流即可。批也可以看成流 Flink保姆级教程超全五万字学习与面试收藏这一篇就够了_flink 教程-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/914039.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站建设费用如何做账务处理2_网站建设的一般步骤包含哪些?

文章目录 1. APP端抓包配置2. APP端抓包分析3. Web端抓包分析4. 爬虫代码实现 【作者主页】:吴秋霖 【作者介绍】:Python领域优质创作者、阿里云博客专家、华为云享专家。长期致力于Python与爬虫领域研究与开发工作! 【作者推荐】&#xff1a…

网站的市场如何制作沈阳京科医院男科

2 数据库环境说明 3 数据库的命名规则 4 逻辑设计 5 物理设计 5.1 表汇总 5.2 表结构设计 6 数据规划 6.1 表空间设计 6.2 数据文件设计 6.3 表、索引分区设计 6.4 优化方法 7 安全性设计 7.1 防止用户直接操作数据库 7.2 用户帐号加密处理 7.3 角色与权限控制 8 数据库管理与维…

深圳建设招标网站首页渭南网站建设网站排名优化

以下是我整理的前端、后端工程师在开发中经常使用到的API接口,希望能帮到大家~ 手机号码归属地:可根据手机号码查询其省市区、运营商区号行政区划代码等信息。 上亿条数据囊括最新的170、166、147等号段,更新及时、准确度高。空号检测&#…

建网站 3年服务器vs设置网站开发环境

Debezium系列之:Debezium技术专栏第300篇系列文章之打通Debezium实时采集Oracle数据库数据到Kafka集群的技术 一、需求描述二、部署Debezium集群和Oracle连接器三、安装Oracle数据库四、设置具有采集Oracle数据库数据权限的账号1.以系统管理员的身份连接到数据库实例2.创建表空…

做网站可以申请个体户么福州网络公司

Google官方出了一款App遍历工具App Crawler。 文档:应用抓取工具 | Android 开发者 | Android Developers App Crawler工具是Android Jetpack的一部分,它可自动的运行你的App,不需要编写或维护任何代码。 通过App Crawler运行App&…

沈阳市城乡建设部官方网站windows软件开发工具

SpringBoot文件上传 上传文件是互联网中常常应用的场景之一&#xff0c;最典型的情况就是上传头像等&#xff0c;今天就带着带着大家做一个 Spring Boot 上传文件的小案例。 1、pom依赖 <?xml version"1.0" encoding"UTF-8"?> <project xml…

newDay02

1.大致复习一遍自己暑期学习过的Java知识,继续往下学了学数组的动态初始化和一些常见问题,并做了一些练习,完成了部分作业,继续背单词 2.新的作业还差不少,还是得继续写,抽出时间来学学Java 3.今天浪费的时间有点…

【OI 档案-2025】CSP 赛前集训记(初赛后+复赛)

复赛前 - 第一周(9.22 ~ 9.28) Day1 - 周一 斌斌感冒了 awa,这天只能晚自习坐大牢了。 Day2 - 周二 直接来模拟赛吗 0.0,直接从 lzm 搬运吗?有点意思,但是被薄纱,155pts,rk5,没救了。 小梦学习计网 枚举+模拟…

Git 从零到一:以 Gitee 为例的实战与可视化指南

这是一篇"开箱即用"的 Git 入门到进阶实战文。你将从安装、配置、SSH、创建远端仓库与本地初始化开始, 迅速掌握个人开发与团队协作的两种主流程;并结合真实案例(项目 IOT_LLM 与分支 master、heshuangxi…

金华网站建设方案咨询wordpress非法关键词

CloudCompare是一款功能强大的点云后处理软件,本文讲解CloudCompare中文版下载与安装方法。 文章目录 一、CloudCompare下载地址二、CloudCompare安装教程三、CloudCompare中文设置一、CloudCompare下载地址 官方下载地址:http://www.danielgm.net/cc/release/ 二、CloudComp…

代码随想录算法训练营第七天 |第454题.四数相加II、383. 赎金信、第15题. 三数之和

第454题.四数相加II 思路:因为是统计次数,不用考虑坐标和去重复,那我就可以把value值给想成该target出现的次数。先用两个数组构造哈希表,然后再用一个O(n*n)的双重循环,遍历剩下两个数组,用count统计出现次数。…

2018年公司做网站注意事项达人室内设计网注册

光伏电站 简介 每一篇文章开篇我都会写一个内容简介&#xff0c;一来梳理自己的写作思路&#xff0c;二来方便读者整体了解文章写作意图和脉络。本篇是新能源方面的开篇之作&#xff0c;我选取了介绍光伏电站基础知识&#xff0c;首先我们要了解光伏电站基础分类&#xff0c;然…

佛山做网站那家好佛山网约车驾驶员资格证网上报名

一、本文介绍 本文给大家带来的改进机制是2024-1月的最新成果DCNv4,其是DCNv3的升级版本,效果可以说是在目前的卷积中名列前茅了,同时该卷积具有轻量化的效果!一个DCNv4参数量下降越15Wparameters左右,。它主要通过两个方面对前一版本DCNv3进行改进:首先,它移除了空间聚…

fullpage做的网站php网站开发环境

本文软件由网友 zxc 推荐&#xff1b; 什么是 Cyber​​Chef ? Cyber​​Chef 是一款简单、直观的网络应用程序&#xff0c;用于在网络浏览器中执行各种“网络”操作。这些操作包括 XOR 和 Base64 等简单编码、AES、DES 和 Blowfish 等更复杂的加密、创建二进制和十六进制转储…

app 微网站php 网站部署后乱码

来自&#xff1a;Java and Python君Web 开发中几乎的平台都需要一个后台管理&#xff0c;但是从零开发一套后台控制面板并不容易&#xff0c;幸运的是有很多开源免费的后台控制面板可以给开发者使用&#xff0c;那么有哪些优秀的开源免费的控制面板呢&#xff1f;我在 Github 上…

做社区网站怎么做app制作平台下载

给定两个由英文字母组成的字符串 String 和 Pattern&#xff0c;要求找到 Pattern 在 String 中第一次出现的位置&#xff0c;并将此位置后的 String 的子串输出。如果找不到&#xff0c;则输出“Not Found”。 本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试…

什么网站可以买世界杯阿里云服务器免费试用

在编辑VS工程包含路径和库路径时&#xff0c;有时需要添加第三方包的路径&#xff0c;比如c boost库&#xff0c; 为了协作的方便&#xff0c;不合适直接把本地绝对路径添加入工程设置&#xff0c;此时可以添加自定义路径宏&#xff0c; 然后参与协作的每个开发人员&#xff0c…

如何做产品网站推广餐馆网站怎么做

在一次活动中&#xff0c;监控发现某个微服务中心服务的负载较高&#xff0c;数据库写入速度变慢&#xff0c;排查问题。 主要可从以下几个方面排查 1、生产日志级别 日志级别有 DEBUG、INFO、WARING、ERROR&#xff0c;检查生产环境的日志级别&#xff0c;日志打印多&#x…

前沿速览:TrafficVLM、DeepSeek-Terminus、Qwen3-Omni、蚂蚁百灵、Wan2.2-Animate、Qianfan-VL

前沿速览:TrafficVLM、DeepSeek-Terminus、Qwen3-Omni、蚂蚁百灵、Wan2.2-Animate、Qianfan-VLAI Compass前沿速览:TrafficVLM、DeepSeek-Terminus、Qwen3-Omni、蚂蚁百灵、Wan2.2-Animate、Qianfan-VL AI-Compass 致…