​分布式数据库技术基础:数据分布介绍

 

 

1、数据分布的定义

数据分布是指在分布式环境中通过合理分布数据,提高数据操作自然并行度,以达到最优的执行效率的目的。在构建分布式数据库系统运行环境时,必须考虑数据如何分布在系统的各个场地上。

数据分布主要关注的问题是在分布式数据中,如何合理的放置数据,从而使得相关数据之间的相对位置最合适。

2、数据分布的内容

数据分布的内容主要有数据位置存放问题、高效的数据划分问题两个方面。

数据位置存放问题:主要是研究如何把已经划分好的数据合理放置在网络上,以获得最优的执行效率,从而减少网络传输的数据量。

高效的数据划分问题:如何把数据合理的划分开,使得使用率最高的数据能被放置在性能最好的节点上。

3、数据分布的策略

3.1 集中式

所有的全局数据片都安排一个节点上。

优点:因为数据都存放在一个节点上,对数据的控制管理比较容易、数据的一致性、完整性能够得到保证。

缺点:节点负担太重,容易出现性能瓶颈、节点依赖性太强,如果该节点出现故障,将使整个系统崩溃、可靠性相对较差。对节点设备要求会很高。

3.2 分割式 

所有全局数据有且只有一份,它们被分割出若干个逻辑片段,每个逻辑片段被分别指派在特定的节点上,对全局数据进行了划分。

优点:数据存储量大、存放在各个节点可以自治检索和修改数据、因为数据是分布在多个节点上的,如果部分节点出现故障,系统仍然可以运行、可靠性较好。

缺点:针对全局修改、查询等操作需要时间会比集中式长一些,因为数据在不同节点需要进行网络通信。

3.3 复制式 

全局数据有多个副本,每个站点上都有完整的数据副本。

优点:系统可靠性较高、响应速度快、数据恢复很容易。

缺点:保持各个节点的同步修改操作要付出高昂的代价、数据冗余很大。

3.4 混合式

全局数据被划分为若干个数据子集,每个子集被放在不同的节点上,但任何一个节点上都没有保持全部的数据,根据数据的重要性决定各个数据子集副本的数量。

优点:兼顾了分割式和复制式的优点、灵活性好、可以提高系统的效率。

缺点:包括了分割式和复制式的复杂性。

IT技术分享社区

个人博客网站:https://programmerblog.xyz

文章推荐程序员效率:画流程图常用的工具程序员效率:整理常用的在线笔记软件远程办公:常用的远程协助软件,你都知道吗?51单片机程序下载、ISP及串口基础知识硬件:断路器、接触器、继电器基础知识

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/270961.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

uname命令 linux,Linux uname命令详解

Linux uname命令用于显示系统信息。uname可显示电脑以及操作系统的相关信息。语法参数:uname [参数]参数:-a或--all:显示全部的信息;-m或--machine:显示电脑类型;-n或-nodename:显示在网络上的主…

分布式数据库技术基础:数据分片介绍

1、数据分片定义数据分片也成为数据分割,是分布式数据库的特征之一。一般在一个分布式数据库中,全局数据库是由各个局部数据库逻辑组合而成的,反之各个局部数据库是由全局数据库的某种分割逻辑而得的。数据分片得到的各部分元组成为该关系的逻…

分布式数据库技术基础:分布透明性相关知识

1、分布透明性介绍数据分布独立性:主要是指用户或用户程序使用分布式数据库如同使用集中式数据库那样,不必关系全局数据的分布情况。也就是说全局数据的逻辑分片、片段的物理位置分配、各场地数据库的数据模型等情况对用户和用户应用程序是透明的。因此分…

宏基4750网卡驱动linux,宏基4750g网卡驱动下载

宏基4750g网卡驱动是宏基笔记本上网驱动,驱动可以帮助用户体验便捷上网功能,只需要的双击驱动安装就可以完成,网卡驱动是笔记本必备程序,欢迎用户来当易网下载体验!驱动介绍Acer宏碁Aspire 4750G笔记本网卡驱动14.4.0.…

python request post 数组_[pve][python]用python3获取pve状态信息

手头的Proxmox VE集群和节点越来越多,需要考虑统一管理了,先定一个小目标——集中状态监控。以前写过检测ceph并用钉钉报警的bash脚本,这次换上洋气的方式,用python来通过pve的api获取其状态信息。首先参考proxmox官方的api(实际上…

分布式数据库管理系统介绍

1、分布式数据库管理系统分类综合型体系结构:主要是指在分布式数据库建立之前,还没有建立独立的集中式数据库管理系统,设计人员根据用户的需求,设计出一个全新的完整的数据库管理系统。联合型体系结构:主要是指每个节点…

linux中国用户,Linux中国 适合新用户的Linux

这个争论无疑给许多Linux用户带来了麻烦。争论的焦点一般不是哪个发行版是真正最适合新用户的,而是哪个发行版受这些争论者的喜爱。如果我们撇开个人喜爱,我们会看到更清楚的一面。但即使这样,明确的结论也会受到被新用户的需求和期望的影响。…

关于局部变量表slot的理解

看下图代码例子,double类型的b,占用两个slot,所以index为3和4

分布式查询处理和优化相关知识介绍

一、分布式数据库查询考虑的因素1、和集中式数据查询一样需要考虑查询语言语句的优化2、数据和信息均需要通过通信线路进行数据传输,存在传输延迟问题从而影响整个查询的执行效率。3、网络中多处理器的存在提供了并行数据处理和传输的机会,可以充分利用该…

操作数栈的字节码指令执行分析

一:写个demo 二:点击Recompile编译 三:使用javap命令反编译class文件 javap -v 类名.class 四:查看结果 五:分析执行过程 首先bipush意思是把byte类型的变量i的值15存放到操作数栈中,istore_1的意思…

分布式数据库基础:分布式事务相关概念介绍

1、事务的定义事务式访问数据库的一个逻辑工作单位,它属于一个操作序列,执行这个操作序列使数据库从一种一致状态转换到另外一种一致状态,从而实现特定业务的功能。2、分布式事务的定义分布式事务属于传统事务的扩展,分布式事务继…

windows比linux差在哪,怎么让新手理解Linux比Windows好在哪里!

pingpang2008 于 2009-06-17 08:54:31发表:人好多啊hantu 于 2009-06-16 23:28:57发表:哈哈,偏偏很多人就是不爽windows了才用Linux的刘冲 于 2009-06-16 21:44:08发表:linux比windows好吗?wayoking 于 2009-06-16 20:45:11发表:理解了,谢谢cscs2002 于 …

大型分布式存储方案MinIO介绍,看完你就懂了!

1、MinIO是什么?官方解释:MinIO 是一个基于Apache License v2.0开源协议的对象存储服务。它兼容亚马逊S3云存储服务接口,非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等,…

部署好网站,同局域网中电脑无法访问的问题的解决方案

“部署好网站,同局域网中电脑无法访问的问题的解决方案"。 第一,Win7安装IIS后,本地测试没问题,说明IIS配置正确;如果本地测试有问题,先检查IIS安装配置情况。 第二,检查计算机网络情况&am…

linux下julia的开发环境,Ubuntu搭建Julia远程开发环境

Julia作为一门新兴的编程语言,还是可以学一学的,这里总结了一下Ubuntu系统远程搭建Julia开发环境的方法。前期准备:云服务器一台,操作系统为Ubuntu18.04,xshell6 vscode。环境安装;首先使用xshell远程连接云服务器&am…

ElementUI:文本框实现远程搜索的用法

❤️作者主页:IT技术分享社区 ❤️作者简介:大家好,我是IT技术分享社区的博主,从事C#、Java开发九年,对数据库、C#、Java、前端、运维、电脑技巧等经验丰富。 ❤️个人荣誉: 数据库领域优质创作者🏆&#x…

栈桢的结构

栈桢里面主要有局部变量表,操作数栈,方法返回地址,动态链接,和一些附加信息