视频生成链接网站开发公司土建工程师绩效考核

diannao/2026/1/16 23:13:52/文章来源:
视频生成链接网站,开发公司土建工程师绩效考核,做网站用的pm是啥,wordpress weixin目录 1.介绍下HBase 2.HBase优缺点 3.介绍下的HBase的架构 4.HBase的读写缓存 5.在删除HBase中的一个数据的时候#xff0c;它是立马就把数据删除掉了吗? 6.HBase中的二级索引 7.HBase的RegionServer宕机以后怎么恢复的? 8.HBase的一个region由哪些东西组成? 9.…目录 1.介绍下HBase 2.HBase优缺点 3.介绍下的HBase的架构 4.HBase的读写缓存 5.在删除HBase中的一个数据的时候它是立马就把数据删除掉了吗?   6.HBase中的二级索引 7.HBase的RegionServer宕机以后怎么恢复的? 8.HBase的一个region由哪些东西组成? 9.HBase高可用怎么实现的? 10.为什么HBase适合写多读少业务? 11.列式数据库的适用场景和优势? 12.HBase的rowkey设计原则 13.HBase的rowkey为什么要唯一? 14.HBase的大合并、小合并是什么? 15.HBase和关系型数据库(传统数据库)的区别(优点)? 16.HBase为什么随机查询很快?   17.HBase的Get和Scan的区别和联系? 18.HBase数据compact流程   19.MemStore Flush条件 20.既然HBase底层数据是存储在HDFS上为什么不直接使用HDFS而还要用HBase 21.HBase和Phoenix的区别 22.HBase支持SQL操作吗 23.HBase表设计 24.Region分配 25.HBase的Region切分 26.介绍下HBase中的LSM树 27.HBase写数据流程 28.HBase读数据流程 29.HBase优化 1.介绍下HBase HBase是一种基于Hadoop的列式分布式非关系型数据库它是高可靠性、高性能、面向列、可伸缩的分布式存储系统利用HBase技术可在廉价服务器上搭建起大规模结构化存储集群。它是Google论文BigTable的实现。 2.HBase优缺点 优点 a. 高容错性高扩展性高吞吐量 b. 强一致性和持久性数据写入内存后异步刷新到磁盘 c. 采用k-v存储方式意味着即使数据海量增长查询性能也不会急剧下降 d. 列式存储数据模型灵活具备动态添加列簇和列的能力 e. 与大数据生态系统整合紧密可无缝与其他大数据组件协同工作 缺点 a. 由于HBASE按照Row key来读写不支持范围条件查询 b. 结构设计复杂因此数据量少的时候性能并不占优势 c. 不支持表的关联操作并且聚合查询能力差 3.介绍下的HBase的架构 (1) Zookeeper a. 保证HMaster的高可用; b. 存储所有的HRegion的寻址入口 c. 实时监控HRegionServer的上线和下线信息并实时通知给HMaster d. 存储HBase的schema和table元数据 e. Zookeeper Quorum存储-ROOT-表地址、HMaster地址 (2) HMaster 所有Region Server的管理者 a. 对于表的操作create, delete, alter b. 对于RegionServer的操作分配regions到每个RegionServer监控每个RegionServer的状态负载均衡和故障转移 (3) HRegionServer a. 对于数据的操作get, put, delete b. 对于Region的操作splitRegion、compactRegion (4) HFile HBase中KeyValue数据的存储格式 (5) HStore 存储核心由MemStore和StoreFile组成。StoreFile文件数量增长到阈值后会触发Compact合并操作多个StoreFile合并为一个StoreFile合并过程中会进行版本合并和数据删除。当单个StoreFile达到一定阈值后会触发Split操作将当前一个Regin分为两个Regin父Regin下线新Regin由HMaster分配到新ReginServer (6) HLog(WAL) 每个HReginServer中有一个HLog避免HBase意外宕机时MemStore数据丢失。HLog定期删除已经持久化的数据。当HReginServer意外终止后HMaster通过Zookeeper感知到先处理遗留的HLog将其中不同Regin的Log数据拆分分发到相应的Regin目录下然后再将失效的Regin重新分配领取到这些Regin的HReginServer在Load Regin时发现有历史HLog需要处理就将其中数据Replay到MemStore中然后Flush到StoreFile完成数据恢复 (7) HDFS HDFS为Hbase提供最终的底层数据存储服务同时为HBase提供高可用的支持 (8) hbase-client 用来访问hbase集群 4.HBase的读写缓存 读缓存BlockCache 写缓存MemStore 5.在删除HBase中的一个数据的时候它是立马就把数据删除掉了吗?   不是只是将删除操作记录下来在StoreFile文件比较多进行合并时清理过期或者删除的数据。 6.HBase中的二级索引 1背景 HBASE中只有RowKey作为一级索引在查询非RowKey数据时需要通过MR或Spark等计算框架效率特别低并且特别消耗资源。 2原理 建立各列值与行键之间的映射关系。 3问题 索引和数据不一致。 参考hbase--索引概念(含二级索引)_hbase索引-CSDN博客 7.HBase的RegionServer宕机以后怎么恢复的? (1) HMaster检测到服务器宕机通过Zookeeper; (2) HLog切分一个ReginServer只有一个HLog因此要将HLog按照Regin进行切分完成后Regin连同对应的HLog被HMaster分往新的ReginServer; (3) 被分配了新的Regin的ReginServer根据HLog进行丢失数据的恢复恢复完成后继续对外服务。 8.HBase的一个region由哪些东西组成? 有一个或多个Store每个Store存放一个列簇 每个Store由一个MemStore和0个或多个StoreFile组成。 9.HBase高可用怎么实现的? 数据复制数据能够在不同的ReginServer之间进行复制 Zookeeper用于检测和管理各个节点的状态并触发相应的操作 RegionServer自动恢复出现故障后上面的数据会被HMaster发到其他ReginServer。 10.为什么HBase适合写多读少业务? HBase存储引擎使用LSM树实现 写的时候先将数据存在内存中达到阈值后再顺序写到磁盘上避免了随机写读的时候HBase只有rowkey索引并且很难命中内存中数据需要访问较多磁盘。 11.列式数据库的适用场景和优势? 适用场景 a. 查询过程中可针对各列的运算并发执行在内存中聚合完整记录集降低查询响应时间 b. 因为各列独立存储且数据类型已知可以针对该列的数据类型、数据量大小等因素动态选择压缩算法以提高物理存储利用率 优势 a. 列存模式下只需要读取参与计算的列即可极大的减低了IO花费 b. 同一列中的数据属于同一类型压缩效果显著 适合OLAP系统 12.HBase的rowkey设计原则 1长度 Rowkey是一个二进制码流太长浪费磁盘并且MemStore中存储数据量也少建议10~100长度最佳为16因为64位操作系统内存8字节对齐为8的整数倍最佳 2散列原则 将RowKey高位字段作为散列字段避免热点数据集中在一个ReginServer上 3唯一原则 rowkey 是按照字典顺序排序存储的因此可以将经常读到的数据放在一起。 13.HBase的rowkey为什么要唯一? 因为HBase是k-v存储重复的话旧数据会被新数据覆盖 14.HBase的大合并、小合并是什么? 小合并(Minor Compaction) 合并相邻的StoreFile为一个较大的StoreFile 大合并Major Compartion 将所有StoreFile合并为一个StoreFile伴随着数据的删除清理 15.HBase和关系型数据库(传统数据库)的区别(优点)? (1)数据类型 HBase只有字符串存储传统的关系型数据有着丰富的存储类型 (2)数据的操作 HBase只有表内数据的操作没有表之间的关联 (3)存储方式 HBase是列式存储 (4)数据维护 HBase的修改和删除不是马上执行操作后并不是第一时间内生效 (5)可伸缩性 HBase能够很容易的增加/减少节点 16.HBase为什么随机查询很快?   (1)只需要遍历相关Regin   (2)只需要遍历相关列簇   (3)先内存再磁盘   (4)根据key遍历 17.HBase的Get和Scan的区别和联系? 区别 a. Get根据RowKey获取唯一值 b. Scan按照指定的条件和顺序扫描表中的多行数据 c. Get操作在内部对数据进行缓存因此适用于对特定行的频繁读取。而Scan操作不会缓存数据适用于一次性读取大量数据或按顺序遍历数据。 联系 a. Get和Scan都可以使用过滤器Filters进行数据过滤以便按照特定条件筛选所需的数据 b. Get和Scan都可以选择返回的列族和列限定符以获取特定的列数据。 18.HBase数据compact流程   (1) 触发   (2) 选择合并目标   (3) 合并对选中的StoreFile进行归并排序并进行合并合并同时处理文件版本时间戳等信息   (4) 清理合并完成后原有StoreFile会废弃HBase会将其删除并释放相应空间   (5) 更新元数据Compaction完成后HBase会更新相应的元数据信息 19.MemStore Flush条件 MemStore达到阈值所在regin都会flush 达到MemStore的4倍默认停止写入MemStore ReginServer中MemStore总大小达到阈值全体flush达到时间阈值触发flushWAL文件数量超过阈值regin整体flush 20.既然HBase底层数据是存储在HDFS上为什么不直接使用HDFS而还要用HBase HDFS更多的功能是大文件的存储创建/删除文件管理权限对大文件的数据读取/追加。但是如果要对所存储的数据做修改/删除/插入/随机写HDFS就做不到了HBase是基于HDFS进行超大数据集的分布式存储以及对数据的增删改查 21.HBase和Phoenix的区别 Phoenix是HBase的开源SQL中间层允许使用JDBC方式操作HBase上的数据HBase创建的表Phoenix看不到Phoenix创建的表HBase能看到Phoenix具备二级索引Phoenix支持表之间的Join操作 22.HBase支持SQL操作吗 不直接支持传统SQL语句使用自身API实现操作数据 23.HBase表设计 列簇设计在合理范围内能尽量少的减少列簇就尽量减少列簇数据保留的版本数数据保留时间rowkey设计预分区 主要解决热点问题避免数据吞吐量过大时单个Regin负载过大 rowkey长度不宜过大唯一性原则 24.Region分配 任何时刻一个Regin只能分给一个ReginServerMaster记录了有哪些可用的ReginServer以及当前有哪些Regin分配给了哪些ReginServer。当需要分配新的Regin并且一个ReginServer有空间时Master则会向ReginServer发送装载请求ReginServer开始提供服务。 25.HBase的Region切分 1prepare阶段 在内存中初始化两个HReginInfo对象包含tableNamereginNamestartKeyendKey以及transaction journal用来记录切分的进展。 2execute阶段 a. RegionServer 更改ZK节点 /region-in-transition 中该Region的状态为SPLITING b. Master通过watch节点/region-in-transition检测到Region状态改变并修改内存中Region的状态 c. 在父存储目录下新建临时文件夹.split保存split后的daughter region信息 d. 关闭parent regin会触发flush操作确保数据全部落盘 e. 核心分裂步骤在.split文件夹下新建两个子文件夹称之为daughter A、daughter B并在文件夹中生成reference文件分别指向父region中对应文件 f. 父region分裂为两个子region后 将daughter A、daughter B拷贝到HBase根目录下形成两个新的region g. parent region通知修改 hbase.meta 表后下线不再提供服务 h. 开启daughter A、daughter B两个子region。通知修改 hbase.meta 表正式对外提供服务 (3)rollback阶段 如果execute阶段出现异常则执行rollback操作 26.介绍下HBase中的LSM树 1设计思想 将对数据的修改增量保持在内存中达到指定的大小限制后将这些修改操作批量写入磁盘不过读取的时候稍微麻烦需要合并磁盘中历史数据和内存中最近修改操作所以写入性能大大提升读取时可能需要先看是否命中内存否则需要访问较多的磁盘文件。极端的来说基于LSM树实现的HBase的写性能比Mysql高了一个数量级读性能低了一个数量级。 本质是将写入操作全部转化成磁盘的顺序写入极大地提高了写入操作的性能。 2数据写 a. 数据首先会插入到内存中的树为了防止数据丢失写内存的同时需要暂时持久化到磁盘(WAL)即输入数据时数据会以完全有序的形式先存储在日志文件中对应HBase的MemStore和HLog。当日志文件被修改时对应的更新会被先保存在内存中来加速查询。 b. 当内存中树的数据大小达到阈值时会进行合并操作。合并操作会从左至右遍历内存中的叶子节点与磁盘中树的叶子节点进行合并当合并的数据量达到磁盘的存储页的大小时会将合并的数据持久化到磁盘。同时更新父亲节点对叶子节点的指针。 27.HBase写数据流程 a. Client先访问zookeeper获取hbase:meta表位于哪个RegionServer b. 访问对应的RegionServer获取hbase:meta表中数据查询要写入数据Region所在RegionServer c. 访问RegionServer发送写请求 d. ReginServer将数据顺序写入追加到HLogWAL e. 将数据写入对应的MemStore数据会在MemStore进行排序 f. 向客户端发送ack g. 等达到MemStore的刷写时机后将数据刷写到HFile 28.HBase读数据流程 a. Client先访问zookeeper获取hbase:meta表位于哪个Region Server b. 访问对应的Region Server获取hbase:meta表根据读请求的namespace:table/rowkey查询出目标数据位于哪个Region Server中的哪个Region中。并将该table的region信息以及meta表的位置信息缓存在客户端的meta cache方便下次访问 c. 与目标RegionServer进行通讯 d. 分别在MemStore、Block Cache和Store FileHFile中查询目标数据并将查到的所有数据进行合并。此处所有数据是指同一条数据的不同版本time stamp或者不同的类型Put/Delete e. 将查询到的新的数据块BlockHFile数据存储单元默认大小为64KB缓存到Block Cache f. 将合并后的最终结果返回给客户端 29.HBase优化 1预分区 每一个region维护着startRow与endRowKey如果加入的数据符合某个region维护的rowKey范围则该数据交给这个region维护。那么依照这个原则我们可以将数据所要投放的分区提前大致的规划好以提高HBase性能 2RowKey设计 生成随机数、hash、散列值 字符串反转 字符串拼接。 3内存优化 适合就好过大的话虽然性能高但是GC时候时间特别长。 4设置RPC监听数量 默认值为30用于指定RPC监听的数量可以根据客户端的请求数进行调整读写请求较多时增加此值。 RPC监听是指Region Compact后的监听器当一个Region没有被写入新数据并且仅存在较少的数量的旧数据时HBase会自动压缩该Region。在这种情况下HBase将触发rck监听器以便通知相关进程可以将该Region从内存中卸载以释放更多的资源。通过这种方式rck监听器可以帮助保持HBase集群的高性能和稳定性。 5手动控制Major Compaction 默认值604800000秒7天 Major Compaction的周期若关闭自动Major Compaction可将其设为0 6优化HStore文件大小 默认值1073741824010GB如果需要运行HBase的MR任务可以减小此值因为一个region对应一个map任务如果单个region过大会导致map任务执行时间过长。该值的意思就是如果HFile的大小达到这个数值则这个region会被切分为两个Hfile 7优化HBase客户端缓存 默认值2097152bytes2M用于指定HBase客户端缓存增大该值可以减少RPC调用次数但是会消耗更多内存反之则反之。一般我们需要设定一定的缓存大小以达到减少RPC次数的目的 8指定scan.next扫描HBase所获取的行数 用于指定scan.next方法获取的默认行数值越大消耗内存越大 9BlockCache占用RegionServer堆内存的比例默认0.4读请求比较多的情况下可适当调大 10MemStore占用RegionServer堆内存的比例默认0.4写请求较多的情况下可适当调大

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/91269.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

淮安高端网站制作2017最新网站icp备案

1.打开cmd,进入mysql的安装目录下的bin目录下。 执行mysql_upgrade -u root -p --force命令然后输入password,问题解决。

济南网站建站公司不动产登记网站建设

ros2 术语说明: 大家在学习其他的开发语言之前的学习和开发中,应该有接触过某些集成开发环境,比如Visual Studio、Eclipse、Qt Creator等,当我们想要编写程序之前,都会在这些开发环境的工具栏中,点击一个“…

企业建设网站的主要目的华为云服务器官网入口

概述最近做查询,统计和汇总。由于数据量比较庞大,大部分表数据上百万,甚至有的表数据上千万。所以在系统中做sql优化比较多,特此写一篇文章总结一下关于sql优化方面的经验。导致查询缓慢的原因1、数据量过大2、表设计不合理3、sql…

网站优化 保定亚马逊云搭建WordPress

Determine_grade-接受单个数字作为参数,并根据以下评分标准显示分数的字母等级:Score 90-100 80-89 70-79 60-69 Below 60Letter Grade ABCDFcalc_average-以分数列表作为参数,显示分数的平均值,以及与该平均值相等的字母分数。ma…

免费建建网站张掖网站建设0936e

在PHP编程中,数组是一种非常常见和重要的数据结构,而对数组进行排序则是处理和展示数据时必不可少的操作之一。本文将详细介绍PHP中数组排序的各种方法、函数和示例,帮助您掌握如何根据不同需求对数组进行排序。 1. PHP 中的数组排序函数 PH…

2021中文字幕入口网站建站公司专业团队

在Linux系统的目录/var/run下面一般我们都会看到很多的*.pid文件。而且往往新安装的程序在运行后也会在/var/run目录下面产生自己的pid文件。那么这些pid文件有什么作用呢?它的内容又是什么呢?(1) pid文件的内容:pid文件为文本文件&#xff0…

外贸网站建设推广肥东网站建设

目录 前言: 一、Top-K问题描述: 二、不同解决思路实现: ①.排序法: ②.直接建堆法: ③.K堆法 总结: 前言: 上篇文章我们学习了二叉树的顺序存储结构,并且对于实际使用中所常…

网站建设网络推广方案ppt网站建设廴金手指花总壹陆

一、 部署并启动 tomcat 服务器 1). 解压 apache-tomcat-7.0.11.zip 到一个非中文目录下 2). 配置一个环境变量 java_home(指向 JDK 安装的根目录) 或 jre_home 3). 通过双击 apache-tomcat-6.0.16\bin 目录下的 startup.bat, 启动服务器 4). 可以在浏览器中输入 localhost:8…

物流企业网站织梦模板wordpress 搜索 自定义

本文目录 前言一、docx 设置页眉1、完整代码2、实际效果图3、常见问题二、docx 设置页眉及对齐方式1、完整代码2、实际效果图3、常见问题①、对齐方式讲解②、字体号与Pt的对应关系三、docx设置页眉,两段文本,两端对齐1、完整代码2、实际效果图3、需要注意的问题①、为什么使…

织梦 两个网站应用市场下载安装软件

【问题描述】 小明每天都要练功,练功中的重要一项是梅花桩。 小明练功的梅花桩排列成 n 行 m 列,相邻两行的距离为 1,相邻两列的距离也为 1。 小明站在第 1 行第 1 列上,他要走到第 n 行第 m 列上。小明已经练了一段时间&#xff…

网站建设知识点的总结郑州免费建站

索引 索引的概念 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)。 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找…

网站上面的小图标怎么做的建材网站设计

1、大数据流程图 2、大数据各个环节主要技术 2.1、数据处理主要技术 Sqoop:(发音:skup)作为一款开源的离线数据传输工具,主要用于Hadoop(Hive) 与传统数据库(MySql,PostgreSQL)间的数据传递。它…

西安 网站搭建最好看的网站设计

在LabVIEW应用开发和部署过程中,确保LabVIEW版本、硬件驱动和Windows版本之间的一致性和兼容性至关重要。这不仅影响程序的稳定性和性能,还关系到项目的成功实施。本文从多角度详细分析这些因素之间的兼容性问题,并提供相关建议。 兼容性考虑…

怎么自己做网站教程设计网页公司哪里好

2019独角兽企业重金招聘Python工程师标准>>> [引言] 我们在学习Java编程的时候,如果需要开发客户端窗体类型的程序,可以使用JDK中的awt和swing库。本文开始小博老师就继续为大家演示Java窗体编程中的绘图技术,今天主要讲解绘图技术…

企业网站建设合同方案有哪些网站做团购最好

P2015 二叉苹果树 题意: 一个完全二叉树,n个点,n-1个边,每个边都有边权,问保留q个边,所能保留的最大边权是多少 题解: 树形dp dp[u][i]表示u的子树上保留i条边,至多保留的苹果数…

阜阳专业网站建设区块链网站开发

本文列举常见的java定时任务实现方式,并做一定比较。1. 循环内部sleep实现周期执行创建一个thread,run() while循环里sleep()来实现周期性执行; 简单粗暴,作为一个初学者很容易想到。public class Task1 {public static void main(String[] a…

五泉山网页设计宣传网站制作兰州优化定制

2019独角兽企业重金招聘Python工程师标准>>> Java中接口、抽象类与内部类学习 接口与内部类为我们提供了一种将接口与实现分离的更加结构化的方法。 抽象类和抽象方法 抽象方法:仅有声明而没有方法体。 抽象类:包含一个或多个抽象方法的类&am…

网站建设合同表(书)vps如何做网站步骤

这篇文章将介绍如何使用Guava EventBus将更改发布到Java 7 WatchService检测到的目录或子目录中。 Guava EventBus是向应用程序添加发布/订阅通信的好方法。 Java 7 java.nio.file软件包中新增的WatchService用于监视目录中的更改。 由于EventBus和WatchService已在以前的文章中…

网站设置什么意思360建筑网一级消防

本文讨论了领导者在沟通过程中如何避免成为传声筒,通过筛选、处理和总结信息,在向上、向下沟通时保持相关性和真实性,提高沟通效率和效果。原文: The Dumbest Mistake Leaders Make in Communication 中层管理者作为高层领导、下属团队和其他…

网站建设活动广告网站建设 工作建议

我们知道,只要在一个Java类上加上Component、Service、Controller等注解,就可以被加载到Spring容器中,除了以上方式,加了Bean和Import好像也可以将对象添加到Spring容器中,究竟Spring是如何实现这些功能的呢&#xff1…