Hutool - BloomFilter:便捷的布隆过滤器实现

1. 布隆过滤器简介

布隆过滤器(Bloom Filter)是一种空间效率极高的概率型数据结构,用于判断一个元素是否存在于一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,但缺点是有一定的误判率,即判断元素存在时,元素可能实际上并不存在,但判断元素不存在时,元素一定不存在。布隆过滤器在很多场景下都有广泛的应用,比如缓存穿透的防止、URL 去重等。

2. Hutool - BloomFilter 概述

Hutool - BloomFilter 是 Hutool 工具包中的一个模块,它提供了一些基于不同 Hash 算法的布隆过滤器实现,让我们可以方便地在 Java 项目中使用布隆过滤器。

3. 引入依赖

如果你使用 Maven 管理项目,在 pom.xml 中添加以下依赖:

 
<dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.8.16</version>
</dependency>

4. 基本使用示例

下面通过一个简单的示例来展示如何使用 Hutool - BloomFilter。

import cn.hutool.bloomfilter.BloomFilterUtil;
import cn.hutool.bloomfilter.bitMap.DefaultBitMap;
import cn.hutool.bloomfilter.filter.MurmurFilter;public class BloomFilterExample {public static void main(String[] args) {// 初始化布隆过滤器,指定预期元素数量和误判率int expectedInsertions = 1000;double fpp = 0.01;MurmurFilter bloomFilter = (MurmurFilter) BloomFilterUtil.create(new DefaultBitMap(), expectedInsertions, fpp);// 向布隆过滤器中添加元素String element1 = "apple";String element2 = "banana";bloomFilter.add(element1);bloomFilter.add(element2);// 判断元素是否存在于布隆过滤器中boolean contains1 = bloomFilter.contains(element1);boolean contains2 = bloomFilter.contains("cherry");System.out.println("布隆过滤器中是否包含 " + element1 + ": " + contains1);System.out.println("布隆过滤器中是否包含 cherry: " + contains2);}
}

5. 代码解释
  • 初始化布隆过滤器

    • expectedInsertions 表示预期要插入布隆过滤器的元素数量。

    • fpp 表示允许的误判率,这里设置为 0.01,即 1% 的误判可能性。

    • BloomFilterUtil.create 方法用于创建布隆过滤器,DefaultBitMap 是 Hutool 提供的一种位图实现,用于存储布隆过滤器的状态。

  • 添加元素:使用 add 方法向布隆过滤器中添加元素。

  • 判断元素是否存在:使用 contains 方法判断元素是否存在于布隆过滤器中。

6. 不同 Hash 算法的布隆过滤器

Hutool - BloomFilter 提供了多种基于不同 Hash 算法的布隆过滤器实现,除了上面示例中使用的 MurmurFilter,还有 FnvFilter 等。你可以根据实际需求选择合适的布隆过滤器。

import cn.hutool.bloomfilter.BloomFilterUtil;
import cn.hutool.bloomfilter.bitMap.DefaultBitMap;
import cn.hutool.bloomfilter.filter.FnvFilter;public class DifferentHashBloomFilterExample {public static void main(String[] args) {int expectedInsertions = 1000;double fpp = 0.01;FnvFilter bloomFilter = (FnvFilter) BloomFilterUtil.create(new DefaultBitMap(), expectedInsertions, fpp);// 添加元素和判断元素是否存在的操作与上面示例类似}
}

7. 注意事项
  • 误判率:布隆过滤器存在一定的误判率,在使用时需要根据具体场景合理设置误判率。误判率越低,所需的空间就越大。

  • 数据持久化:Hutool - BloomFilter 默认没有提供数据持久化的功能,如果需要在程序重启后继续使用布隆过滤器中的数据,需要自行实现数据持久化逻辑。

通过使用 Hutool - BloomFilter,我们可以方便快捷地在 Java 项目中使用布隆过滤器,解决一些实际的业务问题,如缓存穿透、数据去重等。

学习更多知识点击下面链接

偷偷的学Java

Java业务系统应用技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/895499.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

日常知识点之遗留问题梳理(定时器/时间轮定时器)

1&#xff1a;简单基础 定时器的核心知识点&#xff0c;对我来说就是获取当前时间和设置回调函数。 简单练习&#xff1a; ​ c语言通过gettimeofday 获取当前时间并进行处理 ​ 回调函数的定义&#xff08;函数参数有必要适当存储&#xff09; typedef void(Timerfunc)(vo…

Python + WhisperX:解锁语音识别的高效新姿势

大家好&#xff0c;我是烤鸭&#xff1a; 最近在尝试做视频的质量分析&#xff0c;打算利用asr针对声音判断是否有人声&#xff0c;以及识别出来的文本进行进一步操作。asr看了几个开源的&#xff0c;最终选择了openai的whisper&#xff0c;后来发现性能不行&#xff0c;又换了…

$ npx electron-forge import 一直报权限问题 resource busy or locked,

jackLAPTOP-7DHDAAL0 MINGW64 /e/project/celetron-project/my-electron-app (master) $ npx electron-forge import > Checking your system > Checking git exists > Checking node version > Checking packageManager version √ Found node22.14.0 √ Found gi…

mapbox 从入门到精通 - 目录

&#x1f468;‍⚕️ 主页&#xff1a; gis分享者 &#x1f468;‍⚕️ 感谢各位大佬 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍⚕️ 收录于专栏&#xff1a;mapbox 从入门到精通 文章目录 一、&#x1f340;总目录1.1 ☘️ mapbox基础1.2 ☘️…

Kotlin 2.1.0 入门教程(十五)继承、重写、派生类初始化顺序

继承 所有类都有一个共同的超类 Any&#xff0c;对于没有声明超类型的类来说&#xff0c;Any 是其默认的超类&#xff1a; // 隐式继承自 Any。 class ExampleAny 有三个方法&#xff1a;equals()、hashCode() 和 toString()。因此&#xff0c;所有类都定义了这些方法。 默认…

sqlilabs--小实验

一、先盲注判断 ?id1 and sleep(2)-- 如果发现页面存在注点&#xff0c;使用时间盲注脚本进行注入 import requestsdef inject_database(url):name for i in range(1, 20): # 假设数据库名称长度不超过20low 48 # 0high 122 # zmiddle (low high) // 2while low &l…

【数字】异步FIFO面试的几个小问题与跨时钟域时序约束

入门数字设计的时候&#xff0c;跨时钟域的数据处理是绕不开的课题&#xff0c;特别是多比特数据跨时钟域时&#xff0c;都会采用异步FIFO的方法。 异步FIFO中涉及较多的考点这里记录几个以供大家参考。 1. 异步FIFO的空满判断分别在哪个域&#xff1f; 根据异步FIFO的结构&…

浅谈Java Spring Boot 框架分析和理解

Spring Boot是一个简化Spring开发的框架&#xff0c;它遵循“约定优于配置”的原则&#xff0c;通过内嵌的Tomcat、Jetty或Undertow等容器&#xff0c;使得开发者能够快速构建独立运行的、生产级别的基于Spring框架的应用程序。Spring Boot包含了大量的自动配置功能&#xff0c…

算法06-回溯算法

一、回溯算法详解 回溯算法是一种通过逐步构建解决方案来解决问题的算法。它通常用于解决组合问题、排列问题、子集问题等。回溯算法的核心思想是“试错”&#xff0c;即在每一步尝试所有可能的选项&#xff0c;如果发现当前选择无法达到目标&#xff0c;就回退到上一步&#…

RabbitMQ学习—day2—安装

目录 普通Linux安装 安装RabbitMQ 1、下载 2、安装 3. Web管理界面及授权操作 Docker 安装 强力推荐学docker&#xff0c;使用docker安装 普通Linux安装 安装RabbitMQ 1、下载 官网下载地址&#xff1a;https://www.rabbitmq.com/download.html(opens new window) 这…

降本增效 - VGF 构建轻量高性能日志管理平台

VFG 技术架构 Filebeat 接收Syslog &#xff0c;并进行日志分段&#xff0c;VictoriaLogs 持久化存储日志 &#xff0c;Grafana 可视化、数据查询、告警、数据导出。 为什么要用VictoriaLogs &#xff1f; 与Elasticsearch /Grafana Loki相比几十倍的CPU/内存/存储资源占用的…

初识camel智能体(一)

同目录下配置环境变量.env&#xff0c;内容如下&#xff0c; apikey从魔搭社区获取 QWEN_API_KEY4ff3ac8f-aebc******** 先上干货代码&#xff0c;主代码如下&#xff1a; from colorama import Forefrom camel.societies import RolePlaying from camel.utils import prin…

介绍 Liquibase、Flyway、Talend 和 Apache NiFi:选择适合的工具

在现代软件开发中&#xff0c;尤其是在数据库管理和数据集成方面&#xff0c;选择合适的工具至关重要。本文将介绍四个流行的工具&#xff1a;Liquibase、Flyway、Talend 和 Apache NiFi&#xff0c;分析它们的应用、依赖以及如何选择适合的工具。 1. Liquibase 简介&#xff…

Docker使用指南与Dockerfile文件详解:从入门到实战

Docker使用指南与Dockerfile文件详解:从入门到实战 文章目录 **Docker使用指南与Dockerfile文件详解:从入门到实战****引言****第一部分:Docker 核心概念速览****1. Docker 基础架构****2. Docker 核心命令****第二部分:Dockerfile 文件深度解析****1. Dockerfile 是什么?…

Qt工作总结03 <qSort按某一属性进行排序>

1. 代码样例 QList<QGraphicsTextItem *> Lst;qSort(Lst.begin(),Lst.end(),[](const QGraphicsTextItem *itemA,const QGraphicsTextItem *itemB) {return itemA->toPlainText().toDouble() < itemB->toPlainText().toDouble(); }); 2. 参考 QList 按结构体…

深度学习|表示学习|Instance Normalization 全面总结|26

如是我闻&#xff1a; 1. Instance Normalization&#xff08;IN&#xff09; Instance Normalization&#xff08;IN&#xff09;最早由 Ulyanov et al.&#xff08;2017&#xff09; 提出&#xff0c;主要用于 风格迁移&#xff08;Style Transfer&#xff09; 任务。它的核…

如何保持 mysql 和 redis 中数据的一致性?PegaDB 给出答案

MySQL 与 Redis 数据保持一致性是一个常见且复杂的问题&#xff0c;一般来说需要结合多种策略来平衡性能与一致性。 传统的解决策略是先读缓存&#xff0c;未命中则读数据库并回填缓存&#xff0c;但方式这种维护成本较高。 随着云数据库技术的发展&#xff0c;目前国内云厂商…

探索ELK 的魅力

在大数据时代&#xff0c;海量日志和数据的收集、存储、处理与可视化分析变得越来越重要。而 ELK 堆栈&#xff0c;由 Elasticsearch、Logstash、Beats 和 Kibana 组成&#xff0c;正是一个强大的开源解决方案&#xff0c;帮助开发者和运维人员高效管理和分析日志数据。本文将详…

用vue3写一个好看的wiki前端页面

以下是一个使用 Vue 3 Element Plus 实现的 Wiki 风格前端页面示例&#xff0c;包含现代设计、响应式布局和常用功能&#xff1a; <template><div class"wiki-container"><!-- 头部导航 --><el-header class"wiki-header"><d…

深度学习实战基础案例——卷积神经网络(CNN)基于DenseNet的眼疾检测|第4例

文章目录 前言一、数据准备二、项目实战2.1 设置GPU2.2 数据加载2.3 数据预处理2.4 数据划分2.5 搭建网络模型2.6 构建densenet1212.7 训练模型2.8 结果可视化 三、UI设计四、结果展示总结 前言 在当今社会&#xff0c;眼科疾病尤其是白内障对人们的视力健康构成了严重威胁。白…