桐乡微网站建设公司ppt做视频的模板下载网站有哪些内容

diannao/2026/1/18 8:13:28/文章来源:
桐乡微网站建设公司,ppt做视频的模板下载网站有哪些内容,跨国采购网外贸论坛,wordpress插件安装本地4 HBase 摘要#xff1a;HBase是一种非关系型数据库#xff0c;它是基于谷歌BigTable的开源实现#xff0c;和BigTable一样#xff0c;支持大规模海量数据的存储#xff0c;对于分布式并发数据处理的效率极高#xff0c;易于扩展且支持动态伸缩#xff0c;适用于廉价设备…4 HBase 摘要HBase是一种非关系型数据库它是基于谷歌BigTable的开源实现和BigTable一样支持大规模海量数据的存储对于分布式并发数据处理的效率极高易于扩展且支持动态伸缩适用于廉价设备。HBase实际上就是一个稀疏、多维、持久化的映射表它采用行键、列和时间戳即可轻松锁定数据每个数据都是未经解释的字符串在本文中我们都会具体学习。 在本文中我们会谈及HBase系统架构、相关概念、关键流程、突出特点、性能优化以及基本shell操作。 作者来自ArimaMisaki创作 文章目录4 HBase4.1 HBase基本介绍4.2 HBase应用场景4.3 HBase数据模型4.3.1 数据模型基本概念4.3.2 数据存储视图4.3.3 行存储和列存储4.4 HBase架构4.4.1 基本架构4.4.2 存储架构4.4.3 Region的定位4.4.4 HMaster高可用4.4.5 RegionServer4.5 HBase关键流程4.6 HBase的特点4.6.1 多File的影响4.6.2 Compaction4.6.3 OpenScanner4.6.4 BloomFilter4.7 HBase性能优化4.7.1 行键4.7.2 构建二级索引4.8 HBase常用shell命令4.1 HBase基本介绍 说明HBase是谷歌BigTable的开源实现是一个高可靠、高性能、面向列、可伸缩的分布式存储系统。 特点 适合于存储大表数据并且对大表数据的读写访问可以达到实时级别。利用Hadoop作为其文件存储系统提供实时读写的分布式数据库系统。利用ZooKeeper作为协同服务。 与传统数据库的对比 数据索引关系数据库通常可以针对不同列构建复杂的多个索引以提高数据访问性能。HBase只有一个索引——行键通过巧妙的设计HBase所有的访问方法或者通过行访问或者通过行键扫描从而使得整个系统不会慢下来。数据维护在关系数据库中更新操作会用最新的当前值去替换记录中原来的旧值 4.2 HBase应用场景 特点 海量数据存储不需要完全拥有传统关系型数据库所具备的ACID特性高吞吐量需要在海量数据中实现高效的随机读取需要很好的性能压缩能力能够同时处理结构化和非结构化的数据 4.3 HBase数据模型 4.3.1 数据模型基本概念 说明 简单来说应用程序式以表的方式在HBase存储数据表由行和列构成所有列都是属于某一个列族的。行和列的交叉点称之为cell单元格,cell是版本化的其内容是不可分割的字节数组。表的行键也是一段字节数组所以任何东西都可以保存进去无论是字符串还是数字。HBase的表都是按key排序的排序方式是针对字节的所有的表都必须要有主键key。 表Hbase采用表来组织数据表由行和列组成列划分为若干个列族。 行每个Hbase表由若干行组成每个行有一个行键(row key)。 列族一个Hbase表被分组为许多的列族(Column Family)的集合它是基本的访问控制单元。 列限定符列列族里的数据通过列来定位。 单元格在Hbase表中通过行、列族和列限定符确定一个单元格单元格存储的数据没有数据类型总被视为字节数组byte[]。 时间戳每个单元格都保存着同一份数据的多个版本这些版本用时间戳进行索引。 4.3.2 数据存储视图 说明在HBase中列是可以为空的因此表可以看成是一个稀疏的行集合。但在物理视图中它并没有列的概念其根据列族来存储新的columns可以不仅过声明直接加入一个列族。换而言之下面这个图在物理视角中列是不存在的所谓的列名都是概念而已当我们要把Tom存储入表时应该是以info.name.Tom存入表中的info列族。 4.3.3 行存储和列存储 行存储数据按行存储在底层文件系统中且每一行会被分配固定的空间如关系数据库的元组元组都代表现实世界中的某个实例按照行的方式来存储。 行存储优点有利于增加修改整行记录等操作有利于整行数据的读取操作 行存储缺点单列查询时会读取一些不必要的数据 列存储数据按列为单位进行存储在底层文件系统中如非关系数据库HBase。 列存储优点有利于面向单列数据的读取、统计等操作 缺点整行读取时可能需要多次IO操作 误区说明有很多人会误以为列存储是将元组按列的方式存储实际并不是这个样子。表中元组实际上在列族数据库别无二致不同的是当我们需要找到某个人的某个电话时我们需要现在数据库中找到该元组并投影出它的电脑号码但在列族数据库中我们直接找到电话号码那一列全部拿出即可。 4.4 HBase架构 4.4.1 基本架构 说明 主服务器HMaster负责管理和维护HBase表的分区信息维护HRegionServer列表分配Region负载均衡。HRegionServer负责存储和维护分配给自己的Region处理来自客户端的读写请求。客户端并不是从HMaster主服务器上读取数据而是在获得Region的存储位置信息后直接从HRegionServer上读取数据。客户端并不依赖HMaster而是通过Zookeeper来获得Region位置信息大多数客户端设置从来不喝HMaster通信这种设计方式使得HMaster负载很小。 4.4.2 存储架构 说明按照架构层级可以分为 TableHBase中的表Region根据表的起始Region和结束Region划分区域Store根据列族存储相应的region数据。MemStore缓存区常用于临时读和临时写StoreFile根据Store将region数据存储到物理表上Block物理表最终落实到HDFS的Block中 表HBase表最开始只有一个Region后来不断分裂 RegionRegion拆分速度操作非常快接近瞬间因为拆分之后的Region读取的仍然是原存储文件直到分裂过程结束把存储文件异步地写到独立的文件之后才会读取新文件。 4.4.3 Region的定位 三级模式在Hadoop早期版本中HBase的架构为三级模式即通过Zookeeper来存储root表其中包含最开始的Regionroot表中记录了若干个Meta表Meta表存储了若干个用户Region当需要一个region时需要经过三级模式。 两级模式 Region分为元数据Region和用户Region两类元数据RegionMetaRegion记录了每一个UserRegion的路由信息读写Region数据的路由包括以下几步 找寻MetaRegion地址由MetaRegion找寻UserRegion地址 说明为了加快访问速度Hbase:meta表被保存在内存中。假设Hbase:meta表的每行在内存中大约占用1kb并且每个Region限制为128MB则两层架构可以保存的Region数目是128MB/1KB2172^{17}217个Region。 4.4.4 HMaster高可用 说明Zookeeper可以帮助选举一个Master作为集群的总管并保证在任何时刻总有唯一一个Master在运行这就避免了Master的单点失效问题。主服务器Master主要负责表和Region的管理工作。具体职能如下 管理用户对表的增加、删除、修改、查询等操作实现不同Region服务器之间的负载均衡在Region分裂或合并后负责重新调整Region的分布对发生故障失效的Region服务器上的Region进行迁移 4.4.5 RegionServer 说明RegionServer服务器是HBase中最核心的模块其负责维护分配自己的Region和响应用户的读写请求并且会利用心跳机制把自己的状态报告给Zookeeper。 4.5 HBase关键流程 用户读写数据过程用户写入数据时被分配到相应Region服务器去执行用户数据首先被写入到MemStore和Hlog中只有当操作写入Hlog之后commit()调用才会将其返回给客户端若用户想要读取数据Region服务器会首先访问MemStore缓存如果找不到再到上面的StoreFile中寻找。 缓存的刷新系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中清空缓存并在Hlog里面写入一个标记每次刷写都生成一个新的StoreFile文件因此每个Store包含多个StoreFile文件每个HRegionServer都有自己的Hlog每次启动都检查该文件确认最近一次执行缓存刷新操作之后是否发生新的写入操作如果发现更新则先写入MemStore再刷写到StoreFile开始为用户提供服务。 StoreFile的合并每次进行缓存的刷新时都会生成一个新的StoreFile随着数量的增多挨个查找StoreFile会影响查找的速度。为此调用Store.compact()可以把多个StoreFile合并为一个合并操作比较耗费资源一般不会随便调用而是当数量达到了某个阈值才启动合并。 Store工作原理Store是Region服务器的核心。多个StoreFile可以通过Store.compact()合并成一个但StoreFile过大时又可以触发分裂操作将一个父Region分裂为两个子Region。 Hlog工作原理分布式环境必须要考虑系统出错故在HBase中采用Hlog保证系统的恢复在HBase系统中为每个Region服务器配置了一个Hlog文件它是一种预写式日志用户更新数据必须首先写入日志后才能写入MemStore缓存并且只有当MemStoreH对应的log已经写入磁盘后该缓存内容才能被刷写到磁盘一旦RegionServer发生故障Zookeeper会通过心跳机制检测到其状态而后通知HMaster。HMaster首先会处理故障RegionServer上遗留的Hlog根据Hlog上的记录和Region的对应关系对Hlog文件进行拆分拆分后的Hlog文件分散到Region的目录下Region服务器领取到对应的Hlog文件和Region后Region服务器会根据Hlog重新做一遍数据操作。 4.6 HBase的特点 4.6.1 多File的影响 说明随着File数量的增多HBase读取的时延会变大。 4.6.2 Compaction 说明由于多File带来的影响采用压缩(Compaction)变得尤为重要。Compaction的目的是为了减少同一个Region中同一个ColumnFamily下面的小文件的数目从而提升读取的性能。 Compaction分为两种即Minor和Major。Minor压缩是一种小范围的压缩它的压缩数目有固定的区间限制通常采用这种压缩是压缩一些连续时间范围的小文件且选取压缩文件时遵循一定的算法Major压缩则涉及该Region下整个列族下面所有的HFile文件。 提示压缩的时候不能读写数据。 4.6.3 OpenScanner 说明OpenScanner的过程中会创建两种不同的Scanner来读取Hfile、MemStore的数据其中Hfile对应的为StoreFileScanner而MemStore对应的Scanner为MemStoreScanner。 4.6.4 BloomFilter 说明BloomFilter用来优化一些随机读取的场景即通过get命令读取数据时的场景。它可以用来快速的判断一条用户数据在一个大的数据集合中是否存在。BloomFilter在判断一个数据是否存在时拥有一定的误判率。但对于“用户数据 xxx 不存在”的判断结果是可信的对于HBase的BloomFilter的相关数据其被保存在HFile中。 4.7 HBase性能优化 4.7.1 行键 说明行键是按照字典序存储因此在设计行键时要充分利用排序特点将经常一起读取的数据存储到一块将最近可能会被访问的数据放在一块。 4.7.2 构建二级索引 访问方式访问HBase表中的行有三种方式 通过单个行键访问通过行键区间访问多个行全表扫描 说明HBase只有一个针对行键的索引为了提高访问速度我们可以构建二级索引如 多个表索引多个列索引基于部分列值的索引 4.8 HBase常用shell命令 # 获取帮助 help # 获取命令的详细信息 help status # 查看服务器状态 status # 查看版本信息 version # 查看所有表 list # 创建表 create ‘表名称’, ‘列族名称 1’,‘列族名称 2’,‘列名称 N’ # 查看表的基本信息 desc ‘表名’ # 禁用表 disable Student # 检查表是否被禁用 is_disabled Student # 启用表 enable Student # 检查表是否被启用 is_enabled Student # 查看表是否存在 exists Student # 删除表前需要先禁用表 disable Student # 删除表 drop Student # 插入数据 put ‘表名’, ‘行键’,‘列族:列’,‘值’ # 添加列 alter ‘表名’, ‘列族名’ # 删除列族 alter ‘表名’, {NAME ‘列族名’, METHOD ‘delete’} # 获取指定行中所有列的数据信息 get Student,rowkey3 # 获取指定行中指定列族下所有列的数据信息 get Student,rowkey3,baseInfo # 获取指定行中指定列的数据信息 get Student,rowkey3,baseInfo:name # 删除指定行 delete Student,rowkey3 # 删除指定行中指定列的数据 delete Student,rowkey3,baseInfo:name # 获取指定行中所有列的数据信息 get Student,rowkey3 # 获取指定行中指定列族下所有列的数据信息 get Student,rowkey3,baseInfo # 获取指定行中指定列的数据信息 get Student,rowkey3,baseInfo:name # 查询整表数据 scan Student # 查询指定列簇数据 scan Student, {COLUMNbaseInfo} # 查询指定列的数据 scan Student, {COLUMNS baseInfo:birthday} # 采用BloomFilter指定条件过滤 scan Student, FILTERValueFilter(,binary:24)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/90768.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站做二级域名东莞松山湖

Java 集合的 Set 接口Set类型与List类型的区别Set: 无序、不可重复List: 有序、可重复1、HashSetHashSet的存储结构:HashMap特点:HashSet通过比较存放的哈希码(hashCode)来确定对象存放的位置当两个对象的哈希值相等时&#xff0c…

志愿服务网站建设中标公告门户网站开发专业

一. 进程基本概念: 1.进程: 程序:存放在外存中的一段数据组成的文件 进程:是一个程序动态执行的过程,包括进程的创建、进程的调度、进程的消亡 2.进程相关命令: 1.top 动态查看当前系统中的所有进程信息(根据CPU占用率排序)…

个人如何制作一个网站网站建设制作宝塔面板

全世界只有3.14 % 的人关注了数据与算法之美爱因斯坦曾说过“要是乱糟糟的桌面意味着杂乱无章的脑袋,那空白桌面意味着什么呢?似乎很多在某些领域拥有天赋的人都不喜欢干净整洁的桌面,包括乔布斯和扎克伯格也是,甚至有的人一看到整…

网站ueowordpress自动生成二维码

计算机技术在当今的社会,已经变得越来越热,充斥着我们生活的方方面面。人们的工作或是休闲,离不开互联网和电脑,这既受益于各类软件的诞生,也与时下的技术息息相关。Java作为编程界赫赫有名的语言,在最近几…

十大最坑装修公司排名东莞seo搜索

索引的本质 MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。提取句子主干,就可以得到索引的本质:索引是数据结构。 我们知道,数据库查询是数据库的最主要功能之一。我们都希望查询…

重庆做网站优化推广的公司邢台做网站公司排名

搜狗浏览器是一款日常经常会使用的浏览服务软件,用户可以使用手机获取自己想要的浏览内容,各种浏览操作都可以快速掌握,但是使用浏览器的时候会出现各种动作提示,这样会方便用户的操作,这种动作操作设置以后&#xff0…

160 国际英文网站宝塔面板wordpress静态化

24年软考又要来了,作为高项软考的拦路虎,论文你准备好了吗?!记住在开始考试之前一定要用论文答题纸上把准备好的论文,在规定的时间内写上几遍,一是现在很少动笔写字了。二是、熟悉一下论文考试的感觉。 准备…

网站续费多少钱wordpress显示所有文章列表

linux多线程自己从接触很久也有不少实践,但总是觉得理解不够深刻,不够系统。借这篇文章试着再次系统学习一下linux多线程编程,理解编程的concept,细致看一下POSIX pthread API的实现。还是凭借强大的google search,找到…

网站301检测有什么网站是学做吃的

1.原因分析 后端没接收到uid可能是前端没传递uid也可能是前端传递了uid,但是传递方式与后端接收方式不匹配,导致没接收到更大的可能是因为后端请求方式错了。比如: 2.解决方案 先确定前端传参方式与后端请求方式是匹配的后端get请求的话…

企业网站需要多少费用美篇制作app下载官网免费

题目 有一个大小是N * M的战场地图,被墙壁’#‘分隔成大小不同的区域,上下左右四个方向相邻的空地∵,属于同一个区域,只有空地上可能存在敌人’E’,请求出地图上总共有多少区域里的敌人数小于K。 输入描述 第一行输入为…

网站备案注销找哪个部门软件商店打不开怎么办

java学习 一.io流 简介:io,i代表in,指的是输入,o代表输出。io流是用于处理输入和输出数据的机制。Java的io流主要分为字节流和字符流两种类型。这些流可以用于读取和写入不同类型的数据,如文本,图片&#…

济南做网站 推荐行知科技2022年网络流行语

1、一个人经历了所有的苦难,也不要指望能和谁在一起;我曾经真诚的尝试过,但是结果我不想说。2、只要你愿意,只要我有,整个世界都是你的,而你只能是我的。3、只要你愿意,当你失落失意的时候&…

哪个网站买域名便宜深圳制作网站制作公司

官方扩容指导文档 PVE给虚拟机磁盘扩容 给虚拟机磁盘扩容,选中OpenWRT的硬盘,随后选择调整大小 输入增量大小,即增加多少磁盘空间给硬盘。这里我选择增加4G 进入OpenWRT控制台界面安装一些linux常用查看磁盘的工具(也可以通过网…

微信推广时间关键词优化怎么弄

1、MySQL卸载: (通过yum命令卸载之前安装的mysql, find命令找到mysql文件,再用rm –rf 强制删除/var/lib/mysql) 2、MySQL安装: (使用yum命令安装mysql,安装完成后启动数据库&#x…

黑色炫酷的监控网站html郑州网站建设平台

MSR015/MSR025 是低温漂、低功耗、高精度 CMOS 电压基准, 具有 0.05% 初始精度、低功耗特点。该器件的低输出电压迟滞和低长期输出电压 漂移特性,进一步提高稳定性和系统可靠性。 此外,器件的小尺寸和低运行 电流特性使其非常适合便携…

网站热区图利用关键词进网站后台

网站运营者的救星:雷池WAF社区版 ️ 嘿朋友们!今天我超级激动要跟你们分享一个神器——雷池WAF社区版。这个宝贝对我们这帮网站运营者来说,简直就是保护伞! 智能语义分析技术:超级侦探上线 先说说为啥我这么稀饭它。雷…

安徽集团网站建设亚马逊海外购官方网

这里贴一下自己的模拟SPI驱动,移植的话需要实现SPI管脚的定义和初始化。 一、管脚初始化 MOSI_PIN:设置MOSI为输出模式SCK_PIN:设置SCK为输出模式CSN_PIN:设置CSN为输出模式MISO_PIN:设置MISO为输入模式MOSI_PIN_HIG…

做网站需要要多少钱企业网络品牌维护

文章目录 项目介绍主要功能截图:部分代码展示设计总结项目获取方式 🍅 作者主页:超级无敌暴龙战士塔塔开 🍅 简介:Java领域优质创作者🏆、 简历模板、学习资料、面试题库【关注我,都给你】 &…

网站套站是什么意思网站做电话线用

Pycharm Conda虚拟环境 设置终端进入特定分支而不是主环境base 问题描述 我的电脑有pycharm和anaconda。pycharm采用conda作为管理工具。我每次建立一个pycharm项目,都会为这个项目建立对应的conda解释器。当我希望采用pycharm里的终端时,我希望进入的…

江苏省宿迁市建设局网站首页通知书

文章目录 前言一、获取小程序栈二、生命周期触发总结 前言 界面由A到B,在由B返回A,触发刷新动作 一、获取小程序栈 界面A代码 shuaxin(){//此处可进行接口请求从而实现更新数据的效果console.log("刷新本页面数据啦")},界面B代码 // 返回触…