Redis基数统计之HyperLogLog小内存大用处

转载:https://blog.csdn.net/azhegps/article/details/71158952

我们一直都知道,redis几大常用数据结构,字符串、散列、列表、集合、有序集合。其实后来Redis做了很多补充,其中之一就是HyperLogLog,另外的还有GEO(地理位置),是3.2版本加的。这里我们就来简单介绍下HyperLogLog结构。

       先说用处:这个结构可以非常省内存的去统计各种计数,比如注册ip数、每日访问IP数、页面实时UV(PV肯定字符串就搞定了)、在线用户数等。

       这里看到所有的用处都是xxx数,所以这个数据结构的特点就是,可以比较准确的估算出你要统计的数量,但是却无法知道统计的详细内容。比如统计每日访问IP数,可以获取当时访问过的IP总数量,但是没法知道这些IP都是什么。有得必有失,当然你要统计上面提到的那些内容,可以用集合来处理,这样可以知道数量,也能获得所有的详细列表。但是一个大型的网站,每天IP比如有100万个呢,我们粗算一个IP消耗15字节,那么100万个IP就是15M,如果1千万,就是150M。

        再来看看我们的HyperLogLog,在Redis中每个键占用的内容都是12K,理论存储近似接近2^64个值,不管存储的内容是什么。12K,知道这个数据结构的作用了吧。这也是为什么他不能知道里面的详细内容了。这是一个基于基数估算的算法,只能比较准确的估算出基数,可以使用少量固定的内存去存储并识别集合中的唯一元素。而且这个估算的基数并不一定准确,是一个带有 0.81% 标准错误(standard error)的近似值。HyperLogLog结构,在范围允许的情况下无论多少值,都只会占用12K内存。

       这样比如我们把每日IP记录下来,假设每天有一亿个IP访问,如果使用集合的话,一天的内存使用就是1.5G,假设我们存储一个月的记录,就需要45G容量。但是使用HyperLogLog的话,一天12K,一个月360K。如果我们不需要知道IP具体信息的话,完全可以把这些记录留在内存一年、或者不删都行。如果需要,我们也会把所有的IP访问记录通过其他途径存储起来。把每天的信息存储起来,我们可以计算每月IP总数(MERGE),一年的IP总数等(去重)。

       下面介绍一下HyperLogLog的命令,其实他和集合的命令比较像,只是命令少,不能获取列表而已。另外这个数据结构需要2.8.9及以上的版本才能使用哦~

PFADD

        在执行这个命令之后,HyperLogLog内部的结构会被更新,并有所反馈,如果执行完之后HyperLogLog内部的基数估算发生了变化,那么就会返回1,否则(认为已经存在)就返回0。这个命令还有一个比较神器的就是可以只有键,没有值,这样的意思就是只是创建空的键,不放值。如果这个键存在,不做任何事情,返回0;不存在的话就创建,并返回1。这个命令的时间复杂度为O(1),命令例子:

redis> PFADD  ip:20160929  "1.1.1.1"  "2.2.2.2"  "3.3.3.3"
(integer) 1
redis> PFADD  ip:20160929 "2.2.2.2"  "4.4.4.4"  "5.5.5.5"  # 存在就只加新的
(integer) 1
redis> PFCOUNT  ip:20160929  # 元素估计数量没有变化
(integer) 5
redis> PFADD  ip:20160929 "2.2.2.2"  # 存在就不会增加
(integer) 0
PFCOUNT

        其实在上面的学习中我们已经用过这个了,这里再来介绍下。当命令作用于单个键的时候,返回这个键的基数估算值。如果键不存在,则返回0。当作用于多个键的时候,返回这些键的并集估算值。类似于把这些键都合并了之后,在调用这个命令输出。这个命令在作用于单个值的时候,时间复杂度为O(1),并且具有非常低的平均常数时间;在作用于N个值的时候,时间复杂度为O(N),这个命令的常数复杂度会比较低些。命令例子:

redis> PFADD  ip:20160929  "1.1.1.1"  "2.2.2.2"  "3.3.3.3"
(integer) 1
redis> PFCOUNT  ip:20160929
(integer) 3
redis> PFADD  ip:20160928  "1.1.1.1"  "4.4.4.4"  "5.5.5.5"
(integer) 1
redis> PFCOUNT  ip:20160928  ip:20160929
(integer) 5
PFMERGE

       合并(merge)多个HyperLogLog为一个HyperLogLog。其实这个也很好理解,而合并后的估算基数也近似于所有HyperLogLog估算基数的并集。这个命令的第一个参数为目标键,剩下的参数为要合并的HyperLogLog。命令执行时,如果目标键不存在,则创建后再执行合并。这个命令的时间复杂度为O(N),其中N为要合并的HyperLogLog的个数。不过这个命令的常数时间复杂度比较高。命令例子:

redis> PFADD  ip:20160929  "1.1.1.1"  "2.2.2.2"  "3.3.3.3"
(integer) 1
redis> PFADD  ip:20160928  "1.1.1.1"  "4.4.4.4"  "5.5.5.5"
(integer) 1
redis> PFMERGE ip:201609   ip:20160928   ip:20160929
OK
redis> PFCOUNT  ip:201609
(integer) 5

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/463429.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

matlab中的qr函数

转自:https://blog.csdn.net/qq278672818/article/details/62038630 实数矩阵A的QR分解是把A分解为A QR这里的Q是正交矩阵(意味着QTQ I)而R是上三角矩阵。类似的,我们可以定义A的QL, RQ和LQ分解。更一般的说,我们可以…

(String) 和 String.valueOf() 两种字符串转换的区别

使用 String.valueOf() 进行数据转换,如果被转换的数据为 null, 则这种方法将返回一个 "null" 字符串 (String) 方法进行转换时,如果被转换的数据为 null, 则返回 null 对象而不是一个 "null" 字符串。转载于…

利用有名管道实现进程间的通信

1 /*****************************************************************2 * Copyright (C) 2018 FBI WARNING. All rights reserved.3 * 4 * 文件名称:fifo_write.c5 * 创 建 者:constantine6 * 创建日期:2018年02月26日7 * 描 …

为什么分布式一定要有redis,redis的一些优缺点

1、为什么使用redis 分析:博主觉得在项目中使用redis,主要是从两个角度去考虑:性能和并发。当然,redis还具备可以做分布式锁等其他功能,但是如果只是为了分布式锁这些其他功能,完全还有其他中间件(如zookpeer等)代替,…

Google protobuf使用技巧和经验

Google protobuf是非常出色的开源工具,在项目中可以用它来作为服务间数据交互的接口,例如rpc服务、数据文件传输等。protobuf为proto文件中定义的对象提供了标准的序列化和反序列化方法,可以很方便的对pb对象进行各种解析和转换。以下是我总结…

show部分书...

继续购入中 转载于:https://www.cnblogs.com/Clingingboy/archive/2009/06/09/1499816.html

linux 中用PPA安装软件

一般来说 PPA 提供了三条命令,如下面的命令: sudo apt-get sudo apt-get update sudo apt-get install 其中,第一行的代码后面加上 获得安装软件的地址 第二行为更新系统源地址 第三行为安装软件

HTTP_POST———使用mysql_udf与curl库完成http_post通信模块(mysql_udf,multi_curl,http,post)...

HTTP_POST———使用mysql_udf与curl库完成http_post通信模块(mysql_udf,multi_curl,http,post) 这个模块其目前主要用于xoyo江湖的sns与kingsoft_xoyo自主研发的TCSQL数据库做数据同步,当有feed插入sns数据库,使用触 发器调用该模…

LSM树存储模型

LSM(log-structed-merge-tree) leveldb和rocksdb底层使用LSM树做存储引擎,LSM树使用skiplist做索引,他们先将数据写入内存中,按照key进行划分,定期的merge写入到磁盘中,合并后数据写入下一层le…

js-图片预加载

//图片预加载 //闭包模拟局部作用于(function($){function Preload(imgs,options){this.imgs (typeof imgs string) ? [imgs]:imgs;this.opts $.extend({},Preload.DEFAULTS,options);if(this.opts.order ordered){//有序加载this._ordered();}else{//无序加载this._unord…

LevelDb实现原理

原文地址:http://www.samecity.com/blog/Index.asp?SortID12, 最近由于工作上的需求,需要用到leveldb,因此转载此文章用于以后的查询使用。 LevelDb日知录之一:LevelDb 101 说起LevelDb也许您不清楚,但是…

发现几个常用的asp.net MVC Helper 源码

AspNetMvc.DbC.zipXmlSiteMap.zipXhtmlHelper.zipTreeView.zipQuickMenu.zipRotator_v1-1.zipRSSReader.zipFormValidation.zip转载于:https://www.cnblogs.com/nick4/archive/2009/06/10/1500284.html

排序 八种经典排序算法

排序(Sorting) 是计算机程序设计中的一种重要操作,它的功能是将一个数据元素(或记录)的任意序列,重新排列成一个关键字有序的序列。 我整理了以前自己所写的一些排序算法结合网上的一些资料,共介绍8种常用的排序算法,希望对大家能…

Redis使用过程出现类型转换异常问题- 20190220

问题描述: 使用redis过程中,出现类型转换异常问题,出现在存数据和取数据时。而且相同代码在本地测试无异常,而提交到测试环境,则会出现问题。 问题原因: 最后定位到,原因在使用redis存取数据时&…

表达式求值Spring.Expressions

简介Spring.Expressions命名空间可以用一种强大的表达式语言在运行时操作对象。这种语言可以读写属性值、调用方法、访问数组/集合/索引器的元素、进行算术和逻辑运算,同时支持命名变量,并且能够通过名称从IoC容器获取对象。 在Spring.NET中&#xff0c…

C语言 ,嵌入式 ,数据结构 面试题目(1)

1. 用预处理指令#define 声明一个常数&#xff0c;用以表明1年中有多少秒&#xff08;忽略闰年问题&#xff09; #define SECONDS_PER_YEAR (60 * 60 * 24 * 365)UL 2. 写一个“标准”宏MIN&#xff0c;这个宏输入两个参数并返回较小的一个。 #define MIN(A,B) ((A) < (B) (…

使用Vue写一个登陆页面并在管理页面查看和修改

注册页面代码如下html 1 <!DOCTYPE html>2 <html lang"en">3 <head>4 <meta charset"UTF-8">5 <title>注册</title>6 <link rel"stylesheet" href"css/register.css">7 &l…

MarshalByRefObject 的DOME代码

今天研究了下MarshalByRefObject跨程序通讯&#xff0c;由于今天很晚了&#xff0c;先贴出DOME代码。 分别建立2个winform程序&#xff0c;WinClient和WinServer&#xff0c;2个项目中都有CommunicationInfo类&#xff08;你也可以将CommunicationInfo做成一个类库供2个winform…

坐地铁的好心MM们小心啊,周末刚经历了一个地铁新骗术

先废话少说&#xff0c;直奔主题。这个周日&#xff0c;也就是昨天&#xff0c;很开心的和BF坐5号线去东单看电影&#xff0c;在惠新西街南口那站上来一个小姑娘&#xff0c;也就11&#xff0c;12岁那样&#xff0c;穿着小背心、短裤&#xff0c;脖子上还挂着类似学生证一类的牌…

leveldb资料整理

转自&#xff1a;http://hideto.iteye.com/blog/1328921 最近一段时间在学习leveldb的源码&#xff0c;找到了一些相关的资源&#xff0c;用于后续查考和学习使用。 leveldb介绍 http://code.google.com/p/leveldb/ http://en.wikipedia.org/wiki/LevelDB http://highscalabi…