KMP算法笔记

KMP算法笔记

news/2025/9/15 21:27:53/文章来源:https://blog.csdn.net/Nagato_Yuki_SOS/article/details/116833830

1.KMP算法本质上就是对朴素匹配算法(BF)的一个优化，减少朴素匹配算法中不必要匹配的次数，核心代码和朴素匹配算法差不多，BF是移动字串逐个字符匹配，每次模式串(子串)匹配只移动一个字符单位，而KMP算法是每次模式串匹配移动j-next个字符单位，next存放在next[]数组里，j为匹配失败的那个字符位置。

2.为什么KMP算法可以减少不必要的匹配次数?

利用了之前已经匹配过的字符前缀信息，比如下图:(第一行为主串,第二行为模式串)

可以看到在第七个位置匹配失败,只需要满足主串a字符前面从右边开始，从左往右数的字符串等于模式串c字符前面从左边开始，从左往右数的字符串。其最大字符个数就为next的值，这里就是next[j]=4,接着将模式串移动到模式串j=4(也就是j=next[j])的位置。如下图:
在这里插入图片描述

从两图可以看到模式串移动了2个单位，而不是像BF那样每次移动一个单位。
注意:

模式串移动的过程中i是不会变的。
字符匹配的下标可以从1开始，也可以从零开始。

接下来就是确定next数组的值(next数组计算方法是KMP精华的部分)，能够确保每次模式串移动的单位。

考试时的做法

以前准备数据结构考试计算next[]的时候，只要计算模式串从字符前从右边开始，从左往右数等于模式串字符前面从左边开始，从左往右数的最大字符个数(不包括模式串本身)。
具体计算过程:将模式串的前缀都抽出来,如下图。

在这里插入图片描述

为什么只需要利用模式串？
因为主串和模式串匹配失败时，匹配失败字符的前缀内容是一样的，所以之前的主串a字符前面从右边开始，从左往右数的字符串等于模式串c字符前面从左边开始，从左往右数的字符串可以替换为模式串c字符前面从右边开始，从左往右数的字符串等于模式串c字符前面从左边开始，从左往右数的字符串

编程的方法求next。

说白了就是模式串自己与自己匹配，比较其开头和结尾即可，得到最大相同字符的个数即可，下标建议都从1开始，且next[1]=0，因为模式串本身并不算，所以下图直接从第二个元素开始比。目的是求next[i[的值，举例流程如下图：

在这里插入图片描述

参考文章:KMP

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/333748.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

正则表达式的非捕获性分组

正则表达式的非捕获性分组

非捕获性分组，通常由一对括号加上 ?: 加上子表达式组成，非捕获性分组不会创建反向引用，就好像没有括号一样。如下: var color "#808080"; var output color.replace(/#(?:\d)/,"$1""~~"); console.log(Re…

阅读更多...

Spring Security并发会话控制示例教程–如何限制Java JEE Web应用程序中的用户会话数...

Spring Security并发会话控制示例教程–如何限制Java JEE Web应用程序中的用户会话数...

如果您不知道， Spring安全性可能会限制用户可以拥有的会话数。如果要开发Web应用程序，尤其是Java JEE中的安全Web应用程序 ，则必须提出与在线银行门户相似的要求，例如， 每个用户一次只能有一个会话，或者每…

阅读更多...

prometheus命令_Prometheus 入门

prometheus命令_Prometheus 入门

学习安装 Prometheus 监控和警报系统并编写它的查询。-- Michael Zamot(作者)Prometheus 是一个开源的监控和警报系统，它直接从目标主机上运行的代理程序中抓取指标，并将收集的样本集中存储在其服务器上。也可以使用像 collectd_exporter 这样的插件推送…

阅读更多...

正则表达式的命名分组

正则表达式的命名分组

语法格式：(?<name>…) 命名分组也是捕获性分组，它将匹配的字符串捕获到一个组名称或编号名称中，在获得匹配结果后，可通过分组名进行获取。如下是一个python的命名分组的例子： import re data "#80808…

阅读更多...

python--字符/文本编码解码笔记

python--字符/文本编码解码笔记

字符/文本编码解码笔记1.字符问题编码和解码2.字节概要3.基本的编解码器编码类型史字符编码ASCII码GB2312以及其他编码UNICODE标准编码UTF-8编码4.了解编解码问题处理UnicodeEncoderError解决方法:处理UnicodeDecodeError解决方法5.修改源代码编码6.查看文件编码方式终端查看文…

阅读更多...

neo4j cypher_Neo4j：Cypher – Neo.ClientError.Statement.TypeError：不知道如何添加Double和String...

neo4j cypher_Neo4j：Cypher – Neo.ClientError.Statement.TypeError：不知道如何添加Double和String...

neo4j cypher最近，我将支持Neo4j的应用程序从Neo4j 3.2升级到Neo4j 3.3，发现围绕类型强制的行为发生了有趣的变化，导致我的应用程序抛出了很多错误。在Neo4j 3.2和更早版本中，如果将String添加到Double，它将把Double…

阅读更多...

easyui数据表格显示复选框_【Excel技巧】使用控件一键切换实现单位元和万元随意显示...

easyui数据表格显示复选框_【Excel技巧】使用控件一键切换实现单位元和万元随意显示...

工欲善其事，必先利其器。职场上亦是如此。Excel报表想要做得完美，首先肯定Excel要精通。做一份Excel报表，如果涉及到金额，当金额比较大，单位到底是用元还是万元，经常是大家纠结的一个问题。我们今天就来介绍…

阅读更多...

正则表达式的固化分组

正则表达式的固化分组

固化分组，又叫原子组。语法格式：(?>…) 我们在使用非贪婪模式时，匹配过程中可能会进行多次的回溯，回溯越多，正则表达式的运行效率就越低。而固化分组就是用来减少回溯次数的。实际上，固化分组 (?…

阅读更多...

Requests库基本使用

Requests库基本使用

requests库基本使用基本流程python中一个基于网络请求的模块，功能强大，简单便捷，效率极高，可以取代古老的urllib模块。作用：模拟浏览器向服务器发起请求。基本流程 1.指定URL2.对指定的URL发起请求(get或post)3.获取响…

阅读更多...

tls 使用java生成_同时使用传入和传出连接时，相互TLS身份验证存在Java问题

tls 使用java生成_同时使用传入和传出连接时，相互TLS身份验证存在Java问题

tls 使用java生成在大多数企业环境中，应用程序之间的连接中使用某种形式的安全通信（例如TLS或SSL）。在某些环境中， 相互（双向）身份验证也是一项非功能性要求。有时将其称为双向SSL或双向TLS身份验证。因…

阅读更多...

正则表达式的环视实际应用案例

正则表达式的环视实际应用案例

一、千位分隔符案例（一） 逆序环视和顺序环视结合应用。 **需求：**数字格式化成用 , 分隔的货币格式。正则表达式：(?n)(?<\d)(?<!\.\d*)(?(\d{3})(\.|$)) 测试代码： double[] data new double[] { 0,…

阅读更多...

软件工程专插本_2021年专插本部分招生专业（拟），广科/广东理工/华商/培正/松田/工商大！...

软件工程专插本_2021年专插本部分招生专业（拟），广科/广东理工/华商/培正/松田/工商大！...

小师姐从各专插本交流群中收集到了6所院校的2021年本科插班生拟招生专业：广东理工学院、广东科技学院、广东财经大学华商学院、广州大学松田学院、广东培正学院、广东工商职业技术大学。ps：以下只是拟招生专业，具体还是以考试院公布的为准。另…

阅读更多...

Requests库实战(一)---网页采集器

Requests库实战(一)---网页采集器

网页采集器User-Agent伪装完整代码功能：通过动态url来实现用户输入搜索关键字，返回搜索到的页面。User-Agent伪装一种反爬机制。原理：网站的服务器会检测对于请求的载体身份标识，如果检测到请求的载体身份标识为某一款浏览器&a…

阅读更多...

ES6 对正则表达式的扩展

ES6 对正则表达式的扩展

文章目录修饰符 y修饰符 uECMAScript 6.0（以下简称 ES6）是 JavaScript 语言的下一代标准，已经在 2015 年 6 月正式发布了。它的目标，是使得 JavaScript 语言可以用来编写复杂的大型应用程序，成为企业级开发语言。修饰符…

阅读更多...

transformer机制讲解_【核心代码解读】Transformer-XL

transformer机制讲解_【核心代码解读】Transformer-XL

[论文] Transformer-XL: Attentive Language Models Beyond a Fixed-Length Contextarxiv.orgMotivationTransformer在预训练阶段，设置了固定序列长度max_len的上下文，finetuning阶段，模型不能获取大于max_len的上下文依赖；Tran…

阅读更多...

Neo4j导入：java.lang.IllegalStateException：不支持在单个导入中混合指定和未指定的组所有物...

Neo4j导入：java.lang.IllegalStateException：不支持在单个导入中混合指定和未指定的组所有物...

休息片刻之后，我最近一直在使用Neo4j导入工具 ，并遇到了我最初不理解的有趣的错误消息。我有一些CSV文件，其中包含要导入Neo4j的节点。它们的内容如下所示： $ cat people_header.csv name:ID(Person)$ cat people.csv "…

阅读更多...

Requests库实战(二)---破解百度翻译

Requests库实战(二)---破解百度翻译

功能：爬取到页面中翻译后的文本数据获取请求地址和请求方式先输入dog翻译一下，发现是Ajax请求(动态实时刷新页面)，Ajax请求的数据包可以在网络的XHR中看到。找到输入dog的数据包，通过标头的表单数据kw:dog以及响应的结果就可以…

阅读更多...

局部变量的赋值问题

局部变量的赋值问题

int i 5; i 10;变量 i 在栈帧里面的局部变量表里面，这个局部变量表类似一个数组，里面包含了一些“槽位”来存放局部变量，i 这个变量，就是在局部变量表中的某一个槽位里面，并且 i 只会占用一个槽位，对变量…

阅读更多...

php生成 sku_高并发下，php与redis实现的抢购、秒杀功能

php生成 sku_高并发下，php与redis实现的抢购、秒杀功能

抢购、秒杀是如今很常见的一个应用场景，主要需要解决的问题有两个：1 高并发对数据库产生的压力2 竞争状态下如何解决库存的正确减少（"超卖"问题）对于第一个问题，已经很容易想到用缓存来处理抢购，…

阅读更多...

lambda :: -_无需再忙了：Lambda-S3缩略图，由SLAppForge Sigma钉牢！

lambda :: -_无需再忙了：Lambda-S3缩略图，由SLAppForge Sigma钉牢！

lambda :: ->如果你还没有注意到了，我最近被唠叨试图开始使用时，我遭遇了陷阱AWSλ-S3正式例子。虽然大多数这些愚蠢的错误的指责是对我自己的懒惰，过度自尊和缺乏对细节的关注，我个人觉得，在开始与一家领先的无服…

阅读更多...

最新文章