文山市住房和城乡建设局网站十堰网站建设weitian

web/2025/9/27 22:57:57/文章来源:
文山市住房和城乡建设局网站,十堰网站建设weitian,烤漆 东莞网站建设,个人做网站下载网上图可以吗MPP 架构#xff1a; MPP 架构的产品#xff1a; Impala ClickHouse Druid Doris 很多 OLAP 引擎都采用了 MPP 架构 批处理系统 - 使用场景分钟级、小时级以上的任务#xff0c;目前很多大型互联网公司都大规模运行这样的系统#xff0c;稳定可靠#xff0c;低成本。…MPP 架构 MPP 架构的产品 Impala ClickHouse Druid Doris 很多 OLAP 引擎都采用了 MPP 架构 批处理系统 - 使用场景分钟级、小时级以上的任务目前很多大型互联网公司都大规模运行这样的系统稳定可靠低成本。 MPP系统 - 使用场景秒级、毫秒级以下的任务主要服务于即席查询场景对外提供各种数据查询和可视化服务。 MPP 架构针对问题 MPP解决方案的最原始想法就是消除共享资源。每个执行器有单独的CPU内存和硬盘资源。一个执行器无法直接访问另一个执行器上的资源除非通过网络上的受控的数据交换。这种资源独立的概念对于MPP架构来说很完美的解决了可扩展性的问题。 MPP的第二个主要概念就是并行。每个执行器运行着完全一致的数据处理逻辑使用着本地存储上的私有数据块。在不同的执行阶段中间有一些同步点(我的理解了解Java Gc机制的可以对比GC中stop-the-world,在这个同步点所有执行器处于等待状态)这些同步点通常被用于进行数据交换(像Spark和MapReduce中的shuffle阶段)。这里有一个经典的MPP查询时间线的例子 每个垂直的虚线是一个同步点。例如同步阶段要求在集群中”shuffle”数据以用于join和聚合(aggregations)操作,因此同步阶段可能执行一些数据聚合表join数据排序的操作而每个执行器执行剩下的计算任务。 每个节点内的 CPU 不能访问另一个节点的内存节点之间的信息交互是通过节点互联网络实现的这个过程称为数据重分配。 NUMA 架构和 MPP 架构很多时候会被搞混其实区别还是比较明显的。 首先是节点互联机制不同NUMA 的节点互联是在同一台物理服务器内部实现的MPP 的节点互联是在不同的 SMP 服务器外部通过 I/O 实现的。 其次是内存访问机制不同在 NUMA 服务器内部任何一个 CPU 都可以访问整个系统的内存但异地内存访问的性能远远低于本地内存访问因此在开发应用程序时应该尽量避免异地内存访问。而在 MPP 服务器中每个节点只访问本地内存不存在异地内存访问问题。 MPP 架构的优势 任务并行执行; 数据分布式存储(本地化); 分布式计算; 横向扩展支持集群节点的扩容; Shared Nothing完全无共享架构。 MPP的设计缺陷 所有的MPP解决方案来说都有一个主要的问题——短板效应。如果一个节点总是执行的慢于集群中其他的节点整个集群的性能就会受限于这个故障节点的执行速度(所谓木桶的短板效应)无论集群有多少节点都不会有所提高。这里有一个例子展示了故障节点(下图中的Executor 7)是如何降低集群的执行速度的。 大多数情况下除了Executor 7 其他的所有执行器都是空闲状态。这是因为他们都在等待Executor 7执行完成后才能执行同步过程这也是我们的问题的根本。比如当MPP系统中某个节点的RAID由于磁盘问题导致的性能很慢或者硬件或者系统问题带来的CPU性能问题等等都会产生这样的问题。所有的MPP系统都面临这样的问题。 如果你看一下Google的磁盘错误率统计报告你就能发现观察到的AFR(annualized failure rate,年度故障率)在最好情况下磁盘在刚开始使用的3个月内有百分之二十会发生故障。 如果一个集群有1000个磁盘一年中将会有20个出现故障或者说每两周会有一个故障发生。如果有2000个磁盘你将每周都会有故障发生如果有4000个将每周会有两次错误发生。两年的使用之后你将把这个数字乘以4也就是说一个1000个磁盘的集群每周会有两次故障发生。 事实上在一个确定的量级你的MPP系统将总会有一个节点的磁盘队列出现问题这将导致该节点的性能降低从而像上面所说的那样限制整个集群的性能。这也是为什么在这个世界上没有一个MPP集群是超过50个节点服务器的。 MPP和批处理方案如MapReduce之间有一个更重要的不同就是并发度。并发度就是同一时刻可以高效运行的查询数。MPP是完美对称的当查询运行的时候集群中每个节点并发的执行同一个任务。这也就意味着MPP集群的并发度和集群中节点的数量是完全没有关系的。比如说4个节点的集群和400个节点的集群将支持同一级别的并发度而且他们性能下降的点基本上是同样。下面是一个例子。 16个并行查询会话产生了整个集群最大的吞吐量。如果你将会话数提高到20个以上的时候吞吐量将慢慢下降到70%甚至更低。在此声明吞吐量是在一个固定的时间区间内(时间足够长以产生一个代表性的结果)执行的相同种类的查询任务的数量。Yahoo团队调查Impala并发度限制时产生了一个相似的测试结果。Impala是一个基于Hadoop的MPP引擎。因此从根本上来说较低的并发度是MPP方案必须承担的以提供它的低查询延迟和高数据处理速度。 MPP 架构的 OLAP 引擎 采用 MPP 架构的 OLAP 引擎分为两类一类是自身不存储数据只负责计算的引擎一类是自身既存储数据也负责计算的引擎。 只计算不存储数据 Impala Apache Impala 是采用 MPP 架构的查询引擎本身不存储任何数据直接使用内存进行计算兼顾数据仓库具有实时批处理多并发等优点。 提供了类 SQL类 Hsql语法在多用户场景下也能拥有较高的响应速度和吞吐量。它是由 Java 和 C实现的Java 提供的查询交互的接口和实现C实现了查询引擎部分。 Impala 支持共享 Hive Metastore但没有再使用缓慢的 HiveMapReduce 批处理而是通过使用与商用并行关系数据库中类似的分布式查询引擎由 Query Planner、Query Coordinator 和 Query Exec Engine 三部分组成可以直接从 HDFS 或 HBase 中用 SELECT、JOIN 和统计函数查询数据从而大大降低了延迟。 Impala 经常搭配存储引擎 Kudu 一起提供服务这么做最大的优势是查询比较快并且支持数据的 Update 和 Delete。 Presto Presto 是一个分布式的采用 MPP 架构的查询引擎本身并不存储数据但是可以接入多种数据源并且支持跨数据源的级联查询。Presto 是一个 OLAP 的工具擅长对海量数据进行复杂的分析但是对于 OLTP 场景并不是 Presto 所擅长所以不要把 Presto 当做数据库来使用。 Presto 是一个低延迟高并发的内存计算引擎。需要从其他数据源获取数据来进行运算分析它可以连接多种数据源包括 Hive、RDBMSMysql、Oracle、Tidb 等、Kafka、MongoDB、Redis 等。 计算 存储数据 ClickHouse ClickHouse 是近年来备受关注的开源列式数据库主要用于数据分析OLAP领域。 它自包含了存储和计算能力完全自主实现了高可用而且支持完整的 SQL 语法包括 JOIN 等技术上有着明显优势。相比于 hadoop 体系以数据库的方式来做大数据处理更加简单易用学习成本低且灵活度高。当前社区仍旧在迅猛发展中并且在国内社区也非常火热各个大厂纷纷跟进大规模使用。 ClickHouse 在计算层做了非常细致的工作竭尽所能榨干硬件能力提升查询速度。它实现了单机多核并行、分布式计算、向量化执行与 SIMD 指令、代码生成等多种重要技术。 ClickHouse 从 OLAP 场景需求出发定制开发了一套全新的高效列式存储引擎并且实现了数据有序存储、主键索引、稀疏索引、数据 Sharding、数据 Partitioning、TTL、主备复制等丰富功能。以上功能共同为 ClickHouse 极速的分析性能奠定了基础。 Doris Doris 是百度主导的根据 Google Mesa 论文和 Impala 项目改写的一个大数据分析引擎是一个海量分布式 KV 存储系统其设计目标是支持中等规模高可用可伸缩的 KV 存储集群。 Doris 可以实现海量存储线性伸缩、平滑扩容自动容错、故障转移高并发且运维成本低。部署规模建议部署 4-100台服务器。 Doris3 的主要架构 DTData Transfer负责数据导入、DSData Seacher模块负责数据查询、DMData Master模块负责集群元数据管理数据则存储在 Armor 分布式 Key-Value 引擎中。Doris3 依赖 ZooKeeper 存储元数据从而其他模块依赖 ZooKeeper 做到了无状态进而整个系统能够做到无故障单点。 Druid Druid 是一个开源、分布式、面向列式存储的实时分析数据存储系统。 Druid 的关键特性如下 亚秒级的 OLAP 查询分析采用了列式存储、倒排索引、位图索引等关键技术 在亚秒级别内完成海量数据的过滤、聚合以及多维分析等操作 实时流数据分析Druid 提供了实时流数据分析以及高效实时写入 实时数据在亚秒级内的可视化 丰富的数据分析功能Druid 提供了友好的可视化界面 SQL 查询语言 高可用性与高可拓展性Druid 工作节点功能单一不相互依赖Druid 集群在管理、容错、灾备、扩容都很容易 MPP架构和其他架构数据库的场景对比 Hadoop和MPP两种技术的特定和适用场景为 Hadoop在处理非结构化和半结构化数据上具备优势尤其适合海量数据批处理等应用要求。 MPP适合替代现有关系数据机构下的大数据处理具有较高的效率。 MPP适合多维度数据自助分析、数据集市等Hadoop适合海量数据存储查询、批量数据ETL、非机构化数据分析(日志分析、文本分析)等。 适合场景 有上百亿以上离线数据不更新结构化数据需要各种复杂分析的sql语句 不需要频繁重复离线计算不需要大并发量 几秒、几十秒立即返回分析结果即即席查询。例如sumcountgroup byorder

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/83010.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

做网站要什么资质建设网站平台需要的设备

力扣labuladong一刷day38天扁平化嵌套列表迭代器 一、341. 扁平化嵌套列表迭代器 题目链接:https://leetcode.cn/problems/flatten-nested-list-iterator/description/ 思路:本题是一个嵌套列表,如果一次性全部给拉平迭代到一维占用的内存可…

搜狗网站seo成品网页大全下载

本身求平均数很简单的,必须用到combine的话我在两个地方废了很多时间,一是combine的输入不仅仅是map的输出,还有可能是combine的输出,所以对value的处理得分两种情况吧;二是结果要保留4位有效数字。。。噗,…

苏州企业门户网站在哪一个网站上做劳务合同备案

文章目录 概要整体架构流程 概要 把公共的部分单独拆出来&#xff0c;封装到一个新的vue文件夹中&#xff0c; 里面的数据通过父传子的方式传递&#xff0c;子通过props接受&#xff08;静态代码实现的树状图细看代码展示&#xff09; 整体架构流程 <template><!-- …

随州网站建设推荐网页设计公司企业文化

本文针对ubuntu操作系统而言&#xff1a; 补充&#xff1a;1.XAhost命令是X服务器的访问控制工具&#xff0c;用来控制哪些X客户端能够在X服务器上显示。 2.容器与镜像之间的关系&#xff1a;镜像你可以把它看成Java中的类&#xff0c;而容器可以看做是类的实例化对象&#xf…

镇江市丹徒区建设局网站wix和wordpress区别

本来想直接写A* 的&#xff0c;不过看完最佳路径优先搜索算法后觉得还是要先理解一下这个算法后才能更好的理解A* 算法&#xff0c;所以把这篇文章放到A* 前面。 基本概念 最佳优先搜索算法&#xff08;Best-first-searching&#xff09;是一种启发式搜索算法&#xff08;Heu…

php网站培训班湖北营销网站建设联系方式

为了方便阅读将文章分为使用篇和源码解析两篇&#xff0c;上一篇已经写了Handler是什么、有什么、怎们用&#xff0c;这一片从源码的角度分析完整流程&#xff0c;看看Handler消息机制到底是啥原理。才疏学浅&#xff0c;如有错误&#xff0c;欢迎指正&#xff0c;多谢。 完整…

合肥网站公司网站制作风格

GD官方提供的很多KEIL例程为KIEL4的版本&#xff0c;读者使用的时候可能会碰到使用KEIL5打开KEIL4的工程会报错以及无法找到芯片选型的问题&#xff0c;具体表现如下图所示。 我们该怎么办呢&#xff1f; 下面为大家介绍两种方法&#xff1a; 第一种方法是在keil4的工程后缀u…

网站建设视频教程集西安建设工程交易网

文章目录 1、ZAB协议介绍2、消息广播 1、ZAB协议介绍 ZAB 协议全称&#xff1a;Zookeeper Atomic Broadcast&#xff08;Zookeeper 原子广播协议&#xff09;。 Zookeeper 是一个为分布式应用提供高效且可靠的分布式协调服务。在解决分布式一致性方面&#xff0c;Zookeeper 并…

招设计师在哪里找模板网站建设乐云seo效果好

参考 (1) https://www.cnblogs.com/tongchengbin/p/7670927.html

淘宝页面设计的网站广东网络seo推广公司

提前说一点&#xff1a;如果你是专注于Python开发&#xff0c;那么本系列知识点只是带你入个门再详细的开发点就要去看其他资料了&#xff0c;而如果你和作者一样只是操作其他技术的Python API那就足够了。 本篇介绍一下Python的内置函数也叫高阶函数&#xff0c;就是Python自…

新余网站开发中山网站建点

SMS群发信息API接口支持哪些格式&#xff1f;如何使用API接口&#xff1f; SMS群发信息API接口被广泛应用于企业营销、客户服务、身份验证等多个领域。确保SMS群发信息API接口的安全性&#xff0c;已成为企业和开发者们必须重视的问题。AoKSend将探讨几种保障SMS群发信息API接…

东昌府聊城网站优化wordpress单本小说模板

1. 第一个坑 【gcc版本不匹配】 请确认你的gcc版本是不是12的&#xff0c;11是编译不通过的。 一般在最后编译时报错&#xff0c;在/var/log/nvidia-installer.log日志中可以看到以下字样 Warning: Compiler version check failed:The major and minor number of the compil…

葫芦岛市城乡建设局网站如何在手机上设计房屋装修效果图

Dynamic Web TWAIN用于快速部署 Web 应用程序的文档扫描 SDK&#xff0c;文档扫描SDK&#xff0c;&#xff0c;超过 5300 家公司信任 Dynamic Web TWAIN &#xff0c;因其稳健性和安全性而受到超过 5300 家公司的信赖&#xff0c;Dynamic Web TWAIN 是一款基于浏览器的文档扫描…

目前网站开发状况wordpress远程图片模块

文章目录 文档列表文档下载文档列表

怎么进行网站推广做网站需要搭建服务器么

1.2D转换 转换&#xff08;transform&#xff09;你可以简单理解为变形 移动&#xff1a;translate 旋转&#xff1a;rotate 缩放&#xff1a;sCale 移动&#xff1a;translate 1.移动具体值 /* 移动盒子的位置&#xff1a; 定位 盒子的外边距 2d转换移动 */div {width…

怎么提高网站加载速度十大装潢公司上海

添加更多特征会使所有的模型变得更加复杂&#xff0c;从而增大过拟合的可能性。 在添加新特征或处理一般的高位数据集时&#xff0c;最好将特征的数量减少到只包含最有用的那些特征&#xff0c;并删除其余特征&#xff0c;这样会得到泛化能力更好、更简单的模型。 对于如何判…

网站设计找谁做网站建设资料

文章目录 @[TOC]1、 需求及效果1.1 需求1.2 效果2、 思路及SQL语句3、实现折叠明细表4、结语1、 需求及效果 1.1 需求 想要查看U8的审批流程,查看流程在哪个节点或人停留的时间,这个单据整个流程走下来需要的时间。可以更加直观方便的查看审批效率 1.2 效果 采用了SSRS上…

视频网站开发公司有哪些公司邢台哪儿能做网站

当涉及到与1688官方合作的API接口时&#xff0c;以下是一些建议和指导&#xff0c;以帮助您开始编写相关的代码。 了解API接口文档&#xff1a; 在编写与1688官方合作的API接口之前&#xff0c;首先需要了解1688官方提供的API接口文档。您可以在1688开放平台上找到相关的文档…

沈阳网站建设的价格佛山网站建设方案咨询

本文原word格式百度云盘下载地址&#xff1a;综述 2需求 2作者 2系统一览 2Unity3d客户端 2PHP后台 4准备 6XAMPP 6官网 6下载地址 6教程 6ThinkPHP 6官网 7项目所用版本 7下载地址 7快速入门 7完全手册 7步骤 7准备ThinkPHP 7修改MySQL设置信息 8检测是否成功 9扩展&#xff1…

集约化网站建设情况企业网站做备案

【1】基础学习笔记之opencv(1)&#xff1a;opencv中facedetect例子浅析 http://www.cnblogs.com/tornadomeet/archive/2012/03/22/2411318.html【2】OpenCV学习笔记&#xff08;二十七&#xff09;——基于级联分类器的目标检测objdect http://blog.csdn.net/yang_xian521/arti…