昆明猫咪科技网站建设做网站公司哪家强

pingmian/2026/1/25 9:07:31/文章来源:
昆明猫咪科技网站建设,做网站公司哪家强,感叹号分销系统,钓鱼网站怎么做的HBase主要性能压力测试有两个#xff0c;一个是 HBase 自带的 PE#xff0c;另一个是 YCSB#xff0c;先简单说一个两者的区别。PE 是 HBase 自带的工具#xff0c;开箱即用#xff0c;使用起来非常简单#xff0c;但是 PE 只能按单个线程统计压测结果#xff0c;不能汇…HBase主要性能压力测试有两个一个是 HBase 自带的 PE另一个是 YCSB先简单说一个两者的区别。PE 是 HBase 自带的工具开箱即用使用起来非常简单但是 PE 只能按单个线程统计压测结果不能汇总整体压测数据更重要的是PE 没有 YCSB 的 预设模板Workload 功能测试场景单一相较而言YCSB 要强大的多它的 Workload 功能非常实用可以模拟更贴近实际使用场景的压力状况。下面分解介绍一下两款工具的使用方法。 1. YCSB 官方文档 https://github.com/brianfrankcooper/YCSB/blob/master/asynchbase/README.md 1.1 全局配置 hbaseYcsbUrlhttps://github.com/brianfrankcooper/YCSB/releases/download/0.17.0/ycsb-hbase20-binding-0.17.0.tar.gz hbaseYcsbPkg$(basename $hbaseYcsbUrl) hbaseYcsbDir$(basename $hbaseYcsbUrl .tar.gz) export YCSB_HOME/opt/$hbaseYcsbDir1.2. 下载 下载地址 https://github.com/brianfrankcooper/YCSB/releases wget $hbaseYcsbUrl -P /tmp/ sudo tar -xzf /tmp/$hbaseYcsbPkg -C /opt $YCSB_HOME/bin/ycsb -h1.3. 建表 cat EOF | hbase shell disable usertable drop usertable n_splits 30 # HBase recommends (10 * number of regionservers) create usertable, cf, {SPLITS (1..n_splits).map {|i| user#{1000i*(9999-1000)/n_splits}}} describe usertable EOF1.4. 加载数据 $YCSB_HOME/bin/ycsb load hbase20 -cp /etc/hbase/conf/ -p columnfamilycf -P $YCSB_HOME/workloads/workloada上述数据加载使用的是方案/模板workloada就是一个properties文件该方案默认写入1000条记录并执行1000次操作readupdatescan等用户可以自定插入的数据量和操作次数例如-p recordcount10000 -p operationcount10000。这里再详细说明 一下recordcount和operationcount两个属性 recordcount 总的插入数据量写入数据的操作不会算到operationcount里面operationcount总的操作次数操作被分成了read、update、scan、insert四种类型可以在配置中设定它们之间的比例但总的操作次数是由operationcount控制的 1.5. 确认数据是否加载成功 cat EOF | hbase shell scan usertable EOF1.6. 选择压测模板Workload 上述加载数据的测试仅仅是一个“冒烟”测试实际进行压测前要根据目标场景选择一个相匹配的 Workload当然也可以完全自定义 Workload以下是存放在$YCSB_HOME/workloads下的6种预定义的 Workload: Workload预制方案说明workloada50% 读 50% 更新读写均衡workloadb95% 读 5% 更新读多写少多数系统比较符合这种场景workloadc100% 读workloadd95% 读 5% 插入读最近更新越新的纪录读取概率越大requestdistributionlatestworkloade95% 扫描 5% 插入小范围查询重Scan不是点查workloadf50% 读50% 读取-修改-写入即读取一个纪录然后修改这个纪录最后写回 1.7. 正式压测 了解了上述不同类型的 Workload 后选择一个符合自身集群使用场景的 Workload然后就可以正式压测了以下以workloadb为例 nohup $YCSB_HOME/bin/ycsb run hbase20 \-cp /etc/hbase/conf/ \-p columnfamilycf \-p recordcount10000000 \-p operationcount10000000 \-P $YCSB_HOME/workloads/workloadb \-threads 3 \-s nohup.out tail -f nohup.out压测执行完毕后会给出类似下图的压测报告 2. PE PE只能统计每个线程执行的情况不能统计整体的状态所以还是推荐使用YCSB。 2.1 建表并执行测试 cat EOF | hbase shell create test-table, {NAME f, REPLICATION_SCOPE1} EOFhbase pe --nomapred --oneContrue --tabletest-table --rows1000000 --valueSize100 --compressSNAPPY --presplit16 --autoFlushtrue randomWrite 16PE的测试报告并不在控制台直接输出这一点不太好而是写入到了HBase的LOG文件如果是EMR会写到/var/log/hbase/hbase.log中PE会分别打出每个线程的延迟状况类似下面这样 3. 附录 3.1. PE 命令行参数 General Options:nomapred 采用MapReduce的方式启动多线程测试还是通过多线程的方式如果没有安装MapReduce或者不想用MapReduce通常我们采用多线程的方式因此一般在命令中加上--nomapred来表示不使用MapReduce。 rows 每个客户端(线程)运行的行。默认值一百万。注意这里的行数是指单线程的行数如果rows100 线程数为10那么在写测试中写入HBase的将是 100 x 10 行 size 总大小,单位GiB。与--rows互斥。默认值1.0。 sampleRate 样本比例:对总行数的一部分样本执行测试。只有randomRead支持。默认值1.0 traceRate 启用HTrace跨度。每N行启动一次跟踪。默认值0 table 测试表的名字如果不设默认为TestTable。 multiGet 如果 0则在执行RandomRead时执行多次获取而不是单次获取。默认值0 compress 要使用的压缩类型GZLZO...。默认值无 flushCommits 该参数用于确定测试是否应该刷新表。默认值false writeToWAL 在puts上设置writeToWAL。默认值True autoFlush 默认为false即PE默认用的是BufferedMutatorBufferedMutator会把数据攒在内存里达到一定的大小再向服务器发送如果想明确测单行Put的写入性能建议设置为true。个人觉得PE中引入autoFlush会影响统计的准确性因为在没有攒够足够的数据时put操作会立马返回根本没产生RPC但是相应的时间和次数也会被统计在最终结果里。 oneCon 多线程运行测试时底层使用一个还是多个链接。这个参数默认值为false每个thread都会启一个Connection建议把这个参数设为True presplit 表的预分裂region个数在做性能测试时一定要设置region个数不然所有的读写会落在一个region上严重影响性能 inmemory 试图尽可能保持CF内存的HFile。不保证始终从内存中提供读取。默认值false usetags 与KV一起写标签。与HFile V3配合使用。默认值false numoftags 指定所需的标签号。仅当usetags为true时才有效。 filterAll 通过不将任何内容返回给客户端帮助过滤掉服务器端的所有行。通过在内部使用FilterAllFilter,帮助检查服务器端性能。 latency 设置为报告操作延迟。默认值False bloomFilter Bloom 过滤器类型[NONEROWROWCOL]之一 valueSize 写入HBase的value的size单位是Byte大家可以根据自己实际的场景设置这个Value的大小。默认值1024 valueRandom 设置是否应该在0和valueSize之间改变值大小;设置读取大小的统计信息默认值: Not set. valueZipf 设置是否应该以zipf格式改变0和valueSize之间的值大小, 默认值: Not set. period 报告每个period行默认值opts.perClientRunRows / 10 multiGet 批处理组合成N组。只有randomRead支持。默认值: disabled replicas 启用区域副本测试。默认值1。 splitPolicy 为表指定自定义RegionSplitPolicy。 randomSleep 在每次获得0和输入值之前进行随机睡眠。默认值0 Note: -D properties will be applied to the conf used. For example: -Dmapreduce.output.fileoutputformat.compresstrue -Dmapreduce.task.timeout60000 Command: filterScan 使用过滤器运行扫描测试根据它的值查找特定行确保使用--rows 20 randomRead 运行随机读取测试 randomSeekScan 运行随机搜索和扫描100测试 randomWrite 运行随机写测试 scan 运行扫描测试每行读取 scanRange10 使用开始和停止行最多10行运行随机搜索扫描 scanRange100 使用开始和停止行运行随机搜索扫描最多100行 scanRange1000 使用开始和停止行最多1000行运行随机搜索扫描 scanRange10000 使用开始和停止行运行随机搜索扫描最多10000行 sequentialRead 运行顺序读取测试 sequentialWrite 运行顺序写入测试 Args: nclients 整数。必须要有该参数。客户端总数和HRegionServers running: 1 value 500 Examples: 运行一个单独的客户端: $ bin/hbase org.apache.hadoop.hbase.PerformanceEvaluation sequentialWrite 13.2. 百分位数值PercentileP99P999 百分位数值是一个统计学中的术语通俗一点解释是把所有的请求响应时间按从小到大的顺序排列起来排在某个百分比位置上的请求响应时间就是这个百分比对应的百分位数值。举个例子就是明白了 P99响应耗时从小到大排列处在99%位置上的耗时即为P99值。假设该值为200ms就意味着99%的用户的响应耗时在200ms之内只有1%的用户的响应耗时大于200ms P99.9 ( P999 )许多互联网公司会采用P99.9值也就是99.9%的用户耗时作为指标通过测量与优化该值就可保证绝大多数用户的使用体验。 至于P99.99值优化成本过高而且服务响应由于网络波动、系统抖动等不能解决之情况因此大多数时候都不考虑该指标。 参考资料 https://hbase.apache.org/book.html#hbase_metrics https://hbase.apache.org/book.html#offheap_read_write https://help.aliyun.com/zh/emr/emr-on-ecs/user-guide/hbase-metrics https://www.cnblogs.com/felixzh/p/10246335.html https://cloud.tencent.com/developer/article/1596748

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/85907.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如东网站建设网页游戏排行榜前十名2021

当在Windows系统中开发网络应用程序时,经常会遇到 "Address already in use: bind" 的错误。这个错误通常表示正在尝试绑定的端口已经被其他程序占用了。本篇技术博客将介绍如何在Windows系统中解决这个问题,并提供实用的解决方案。 在网络应用…

佛山专业做网站的360搜索引擎入口

STM32-GPIO 介绍 什么是GPIO? GPIO(通用输入/输出)是一种用于与外部设备进行数字通信的通用硬件接口。它允许微控制器或其他数字电路的引脚以灵活的方式配置为输入或输出,并在运行时进行动态控制。GPIO可用于连接和控制各种外围…

网站排名易下拉技巧电子商务营销渠道有哪些

2020FRM考试计算器:想一想FRM一级考试基本上按计算器停不下来,我们就一定要买一个简单易操作的计算器,但是GARP对于FRM考生所使用的计算器是有规定的:所有参加FRM考试的考生必须使用GARP指定的计算器,如果考生在考试期…

深圳西乡网站建设公司渝发建设官方网站

Matlab是一种功能强大的数值计算和数据分析软件,它在解决各种数学问题中都具有很高的效率和灵活性。其中,Matlab也可以用于求解标准规划问题,即线性规划问题。 标准规划问题是一种常见的优化问题,其目标是在给定的约束条件下&…

免费写作网站江苏建设网站酒店装修合同范本

http://blog.sina.com.cn/s/blog_6c9d65a1010180mg.html转载于:https://www.cnblogs.com/wangkongming/p/3516449.html

网站建设管理软件网站后台怎么做

1. JWT(JSON Web Token) 1.1 什么是JWT? JWT,全称为JSON Web Token,是一种用于在网络上安全传输信息的开放标准。它的设计初衷是用于跨域通信,在不同域之间传递声明性信息。JWT是一种自包含的令牌&#x…

网站建设书 模板下载深圳网页制作

遇到问题:用npm下载组件时出现Cannot find module ‘D:software\node_modules\npm\bin\npm-cli.js’ 问题,导致下载组件不能完成。 解决方法:下载缺少的npm文件即可解决放到指定node_modules目录下即可解决。 分析问题&#xff1…

泰州北京网站建设兰州免费网站建设

在网络安全领域,ATT&CK已经成为了研究和理解恶意攻击者行为的重要工具。站在攻击者的视角,ATT&CK为我们描绘了他们在攻击过程中所使用的各种战术、技术和常见知识。本文将结合ATT&CK框架,对水坑钓鱼攻击进行深入分析,…

app定制开发 价格哈尔滨网站优化

重定向AutoResponder的用法 关于Fiddler的AutoResponder重定向功能,主要是时进行会话的拦截,然后替换原始资源的功能。 它与手动修该reponse是一样的,只是更加方便了,可以创建相应的rules,适合批处理的重定向功能。 …

行业门户网站大全wordpress ftp上传

如何避免Java死锁? 是Java面试中最受欢迎的问题之一,也是本季多线程的风格,主要是在高层提出,并带有很多后续问题。 尽管问题看起来很基础,但是一旦您开始深入研究,大多数Java开发人员就会陷入困境。 面试…

做美食推广的网站wordpress添加主题提示缺少文件

电感器 文章目录 电感器1、概述2、电感器的时间常数3、电感器示例1 电感器是一种由线圈组成的无源电气元件,其设计目的是利用电流通过线圈而产生的磁力和电力之间的关系。 1、概述 在本中,我们将看到电感器是一种电子元件,用于将电感引入到电…

电子商务网站建设的案例分析题wordpress 皮肤

有道无术,术尚可求,有术无道,止于术。 本系列Spring Boot 版本 2.7.9 本系列Camunda 版本 7.19.0 源码地址:https://gitee.com/pearl-organization/camunda-study-demo 文章目录 1. 前言2. 运行流程实例2.1 查询流程定义2.2 启动流程2.3 任务查询2.4 审批3. 数据表1. 前言…

房山建设网站企业网站建设及维护费用

原文链接地址:http://www.cnblogs.com/killmyday/archive/2009/09/26/1574311.html 我曾经问过很多人,你一般是怎么调试你的程序的? F9, F5, F11, F…… 有很多书和文章都是介绍怎么使用Visual Studio编写WinForm啦,、ASP.NET之类的程序&…

北京网站平台开发适合个人做的跨境电商

1. 通信技术和标准化领域中扮演重要角色的组织 1.1 国际和国家官方标准化机构 OSI:国际标准化组织(ISO),负责国际标准的制定,旨在确保全球产品和服务的安全性、可靠性和效率。它有许多国家分支机构,包括法…

响应式设计网站怎么做聊城哪有做网站的

Linux目录详解: 目录名说明/bin重要的二进制 (binary) 应用程序:包含二进制文件,系统的所有用户使用的命令都在这个目录下/boot启动 (boot) 配置文件:包含引导加载程序相关的文件,开机时用到的引导文件/data数据存储区…

找合伙人的网站做淘宝代理服务器地址是什么意思

一、应用背景 目前,针对审计行业,关于大数据技术的相关研究与应用一般包括大数据智能采集数据技术、大数据智能分析技术、大数据可视化分析技术以及大数据多数据源综合分析技术。其中,大数据智能采集数据技术是通过网络爬虫或者WebService接…

php网站有点seo整站优化哪家专业

名人说:莫愁千里路,自有到来风。 ——钱珝 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 目录 1、函数的概念与定义①函数的概念②函数的具体定义③多返回值 2、函数参数与作用域①可变参数②形…

住房城乡建设部网站通报徐州网络推广服务

在之前的文章里,介绍了比较传统的K-Means聚类、Affinity Propagation(AP)聚类、比K-Means更快的Mini Batch K-Means聚类以及混合高斯模型Gaussian Mixture Model(GMM)等聚类算法,今天介绍一个比较近代的一类算法——Spectral Clustering 中文通常称为“谱…

asp网站怎么改成中英双语彩票网站做维护是什么

http://www.microsoft.com/downloads/details.aspx?displaylangzh-cn&FamilyIDd95598d7-aa6e-4f24-82e3-81570c5384cb#filelist 这是什么?*** 转载于:https://www.cnblogs.com/zxsoft/archive/2008/02/17/1071038.html

河南外贸网站制作迅当网络深圳外贸网站建设

具体程序代码如下,主要问题就是不管我怎么调整参数,最终的预测结果都没有太大的变化,还请了解这两大算法的帮忙看看问题出在哪里了,十分感谢!tic;close all;clear;clc;format compact;load M2.mat %载入数据% 提取数…