布隆过滤器的原理和应用场景,解决缓存穿透

一、布隆过滤器BloomFilter是什么

布隆过滤器BloomFilter是一种专门用来解决去重问题的高级数据结果。

实质就是一个大型位数组和几个不同的无偏hash函数,无偏表示分布均匀。由一个初值为零的bit数组和多个哈希函数组成,用来判断某个数据是否存在,它和HyperLogLog一样,不是那么的精准,存在一定的误判概率。

二、布隆过滤器BloomFilter能干嘛?

高效地插入和查询,占用空间少,返回的结果是不确定的,一个元素如果判断结果为存在,它不一定存在;不存在时,一定不存在。

因为不同的字符串的hashcode可能相同,布隆过滤器BloomFilter是根据hashcode判断的,如果某个hashcode存在,它对应的字符串不一定是你想要的那个字符串;但是,hashcode不存在时,你所要的字符串,肯定不存在,细品~

布隆过滤器BloomFilter只能添加元素,不能删除元素。

这和上面提到的hashcode判定原理是一样的,相同hashcode的字符串会存储在一个index,删除时,是将某个index移除,此时,就可能移除拥有相同hashcode的不同字符串,细品~

三、布隆过滤器使用场景

1、解决缓存穿透问题

一般情况下,先查询Redis缓存,如果Redis中没有,再查询MySQL。当数据库中也不存在这条数据时,每次查询都要访问数据库,这就是缓存穿透。

在Redis前面添加一层布隆过滤器,请求先在布隆过滤器中判断,如果布隆过滤器不存在时,直接返回,不再反问Redis和MySQL。

如果布隆过滤器中存在时,再访问Redis,再访问数据库。

完美解决缓存穿透问题。

2、黑名单

如果黑名单非常大,上千万了,存放起来很耗费空间,在布隆过滤器中实现黑名单功能,是一个很好的选择。

3、网页爬虫对URL的去重,避免爬取相同的URL地址

四、操作布隆过滤器BloomFilter

1、使用布隆过滤器

(1)初始化bitmap

布隆过滤器 本质上 是由长度为 m 的位向量或位列表(仅包含 0 或 1 位值的列表)组成,最初所有的值均设置为 0。

(2)添加key

使用多个hash函数对key进行hash运算,得到一个整数索引值,对位数组长度进行取模运算得到一个位置,每个hash函数都会得到一个不同的位置,将这几个位置的值置为1就表示添加成功。

例如,我们添加一个字符串“哪吒编程”,对字符串进行多次hash(key) → 取模运行→ 得到坑位。

2、删除key

只要有其中一位是零就表示这个key不存在,但如果都是1,则不一定存在对应的key。

3、判断是否存在

向布隆过滤器查询某个key是否存在时,先把这个 key 通过相同的多个 hash 函数进行运算,查看对应的位置是否都为 1,

只要有一个位为零,那么说明布隆过滤器中这个 key 不存在;

如果这几个位置全都是 1,那么说明极有可能存在;

因为这些位置的 1 可能是因为其他的 key 存在导致的,也就是前面说过的hash冲突

五、代码实例

1、使用Redis做缓存

public class StudentSerivce {public static final String CACHE_KEY = "student:";@Resourceprivate StudentMapper studentMapper;@Resourceprivate RedisTemplate redisTemplate;public void addstudent(Student student){int i = studentMapper.insertStudent(student);if(i > 0){//到数据库里面,重新捞出新数据出来,做缓存student=studentMapper.selectByKey(student.getId());//缓存keyString key=CACHE_KEY+student.getId();//往mysql里面插入成功随后再从mysql查询出来,再插入redisredisTemplate.opsForValue().set(key,student);}}public Student findstudentById(Integer studentId){Student student = null;String key=CACHE_KEY+studentId;// 查询redisstudent = (Student) redisTemplate.opsForValue().get(key);// redis没有,查询mysqlif(student==null){// 从mysql查出来studentstudent=studentMapper.selectByPrimaryKey(studentId);// mysql有,redis没有if (student != null) {// mysql的数据写入redisredisTemplate.opsForValue().set(key,student);}}return student;}
}

2、布隆过滤器

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;/*** 布隆过滤器 -> redis -> mysql* @autor 哪吒编程* @date 2023-04-17*/
@Service
public class StudentServiceImpl implements StudentService {public static final String CACHE_KEY = "student:";@Autowiredprivate StudentMapper studentMapper;@Autowiredprivate RedisTemplate redisTemplate;public void addstudent(student student){int i = studentMapper.insertSelective(student);if(i > 0) {//到数据库里面,重新捞出新数据出来,做缓存student=studentMapper.selectByPrimaryKey(student.getId());//缓存keyString key=CACHE_KEY+student.getId();//往mysql里面插入成功随后再从mysql查询出来,再插入redisredisTemplate.opsForValue().set(key,student);}}public student findstudentById(Integer studentId){student student = null;//缓存key的名称String key=CACHE_KEY+studentId;// 查询redisstudent = (student) redisTemplate.opsForValue().get(key);//redis没有,查询mysqlif(student==null) {student=studentMapper.selectByPrimaryKey(studentId);// mysql有,redis没有if (student != null) {// 把mysql捞到的数据写入redisredisTemplate.opsForValue().set(key,student);}}return student;}/*** BloomFilter -> redis -> mysql* 白名单:whites*/public student findStudentByIdWithBloomFilter (Integer studentId) {student student = null;String key = CACHE_KEY + studentId;//布隆过滤器校验,无是绝对无,有是可能有if(!checkWithBloomFilter("whites",key)) {log.info("白名单无此顾客信息:{}",key);return null;}//查询redisstudent = (Student) redisTemplate.opsForValue().get(key);//redis没有,查询mysqlif (student == null) {student = studentMapper.selectByPrimaryKey(studentId);// mysql有,redis没有if (student != null) {// 把mysql捞到的数据写入redisredisTemplate.opsForValue().set(key, student);}}return student;}/*** 查询布隆过滤器中是否存在*/public boolean checkWithBloomFilter(String checkItem,String key) {int hashValue = Math.abs(key.hashCode());long index = (long) (hashValue % Math.pow(2, 32));return redisTemplate.opsForValue().getBit(checkItem, index);}
}

六、总结

  1. 有,是可能有;无,是肯定无;
  2. 使用时z,初始化值尽可能满足实际元素长度,避免扩容;
  3. 当实际元素数量超过初始长度时,应该对布隆过滤器进行重建,再将所有的历史元素批量添加进去;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/69953.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

macOs安装nvm

首先确定本机上没有安装nvm 如果之前安装过先卸载 1. 删除 nvm 目录 首先,删除 nvm 所安装的文件目录。默认情况下,nvm 会安装到 ~/.nvm 目录。 运行以下命令删除 nvm 目录: rm -rf ~/.nvm2. 移除 .zshrc 或 .bash_profile 中的 nvm 配置…

uniapp + vite + 使用多个 ui 库

样式冲突 新建了个项目 安装多个 ui 库 发现 uview-plus 和 Ant Design Vue 3.2.20 的 按钮样式 冲突uvuew-plus 的按钮样式 会被 ant 的样式给覆盖解决方式 找到圆满 ant.css 注释 button, html [type"button"], [type"reset"], [type"submit&quo…

【大语言模型】在大语言模型中,user、assistant、system 三种角色的定位和功能有何不同。

在大语言模型(如GPT系列)中,user、assistant、system 是三种核心角色,它们的定位和功能不同,共同构成对话的上下文结构。以下是具体区别和用途: 1. System(系统角色) 定位&#xff…

react中如何获取真实的dom

在 React 中,获取真实的 DOM 元素通常通过 ref 来实现。ref 是一个特殊的属性,用于引用组件或 DOM 元素的实例。你可以通过 ref 获取到组件的真实 DOM 元素或组件实例。 1. 函数组件中的 useRef 在函数组件中,获取 DOM 元素的引用需要使用 …

关于“前端已死”的命题

翻阅知乎论坛,看了各位大佬的解析,从技术发展、市场环境、岗位需求三个维度综合理解这个命题: 1. 技术层面 前端技术生态并未停滞,反而持续迭代升级。HTML/CSS/JavaScript 核心基础未变,但框架(如 Vue、R…

Docker Compose:编排多容器应用

1. 什么是 Docker Compose? Docker Compose 是一个用于定义和管理多容器 Docker 应用的工具。它通过一个简单的配置文件(docker-compose.yml),让你能够在一个命令下启动、停止和管理多个容器。这使得在开发、测试和生产环境中,管理复杂的应用变得更加简单。 Docker Comp…

(2025)深度分析DeepSeek-R1开源的6种蒸馏模型之间的逻辑处理和编写代码能力区别以及配置要求,并与ChatGPT进行对比(附本地部署教程)

(2025)通过Ollama光速部署本地DeepSeek-R1模型(支持Windows10/11)_deepseek猫娘咒语-CSDN博客文章浏览阅读1k次,点赞19次,收藏9次。通过Ollama光速部署本地DeepSeek-R1(支持Windows10/11)_deepseek猫娘咒语https://blog.csdn.net/m0_70478643/article/de…

Ubuntu安装geteck/jetlinks实战:源码启动

这个还是很复杂的,建议使用docker即可。 参考 使用源码启动JetLinks | JetLinks 物联网基础平台 安装Ubuntu虚拟机(略)安装JDK8编译Redis安装mysql ubuntu安装MySqL server-CSDN博客 初次使用,不要安装ElasticSearch下载源码…

【docker知识】快速找出服务器中占用内存较高的容器

本文由Markdown语法编辑器编辑完成。 1.背景: 近期在处理现场问题,观察服务器时,会遇到某些进程占用较高内存的情况。由于我们的服务,基本上都是以容器的方式在运行,因此就需要找到,到底是哪个容器&#…

Jenkins 安装插件 二

Jenkins 安装插件 二 一. 打开 Dashboard 打开 Jenkins 界面,不管在任何界面,只需要点击左上角 Dashboard 按钮即可 二. 打开 Manage Jenkins 找到 Manage Jenkins -> System Configuration -> Plugins 点击 Plugins 打开界面如下 Updates&a…

OpenCV机器学习(1)人工神经网络 - 多层感知器类cv::ml::ANN_MLP

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 cv::ml::ANN_MLP 是 OpenCV 库中的一部分,用于实现人工神经网络 - 多层感知器(Artificial Neural Network - Multi-Layer…

Qt中的事件

写一个 可以拖动的按钮 DraggablePushButton.h 头文件 #ifndef DRAGGABLEPUSHBUTTON_H #define DRAGGABLEPUSHBUTTON_H#include <QPushButton> #include <QMouseEvent>class DraggablePushButton : public QPushButton {Q_OBJECTpublic:explicit DraggablePushBu…

Postgresql 开发环境搭建指南(WindowsLinux)

一、Postgresql 简介 PostgreSQL 是一个免费的对象-关系数据库服务器(ORDBMS)&#xff0c;在灵活的BSD许可证下发行。 RDBMS 是关系数据库管理系统&#xff0c;是建立实体之间的联系&#xff0c;最后得到的是关系表。 ORDBMS在原来关系数据库的基础上&#xff0c;增加了一些新…

2025前端面试题

2025前端面试题 uniappuniapp如何打包发版到线上 vuevue3构建项目vue如何封装组件vue2的响应式原理vue3的响应式原理vue3和2的区别Vuex中的重要核心属性有哪些&#xff1f;Vue-router有哪几种路由守卫 es6数组有哪些常用方法ES6的新特性Promiseasync/await防抖和节流&#xff0…

大语言模型多代理协作(MACNET)

大语言模型多代理协作(MACNET) Scaling Large-Language-Model-based Multi-Agent Collaboration 提出多智能体协作网络(MACNET),以探究多智能体协作中增加智能体数量是否存在类似神经缩放定律的规律。研究发现了小世界协作现象和协作缩放定律,为LLM系统资源预测和优化…

dify.ai 配置链接到阿里云百练等云厂商的 DeepSeek 模型

要将 dify.ai 配置链接到阿里云百练等云厂商的 DeepSeek 模型. 申请阿里云百练的KEY 添加模型 测试模型

Win10环境使用Dockerdesktop部署Dify集成Deepseek

Win10环境借助Dockerdesktop部署Dify集成Deepseek 前言 之前笔者已经部署了基于Ollama的Deepseek&#xff1a; https://lizhiyong.blog.csdn.net/article/details/145505686 安装官方指示&#xff0c;还可以集成很多组件拓展玩法&#xff1a; https://github.com/deepseek…

23、深度学习-自学之路-激活函数relu、tanh、sigmoid、softmax函数的正向传播和反向梯度。

在使用这个非线性激活函数的时候&#xff0c;其实我们重点还是学习的是他们的正向怎么传播&#xff0c;以及反向怎么传递的。 如下图所示&#xff1a; 第一&#xff1a;relu函数的正向传播函数是&#xff1a;当输入值&#xff08;隐藏层&#xff09;值大于了&#xff0c;就输出…

cameralib 安装

目录 linux安装&#xff1a; 测试安装是否成功&#xff1a; linux安装&#xff1a; pip install githttps://github.com/isarandi/cameralib.git pip install githttps://github.com/isarandi/boxlib.git pip install githttps://github.com/isarandi/poseviz.git githttps…

ML.NET库学习005:基于机器学习的客户细分实现与解析

文章目录 ML.NET库学习005&#xff1a;基于机器学习的客户细分实现与解析项目主要目的和原理目的原理 项目概述实现的主要功能主要流程步骤使用的主要函数方法关键技术 主要功能和步骤功能详细解读详细步骤解析 数据集及其处理步骤数据集处理步骤关键处理步骤原理1. 数据清洗与…