Python入门知识点分享——(十七)正则表达式和re模块

不好意思鸽了这么久,这几天备赛美赛没有太多时间写博客。好了闲话少叙,这次为大家带来的是正则表达式的相关介绍。正则表达式又叫做规则表达式,英文全称Regular Expression。是一种对字符串操作的逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,包括普通字符(如字母a~z)和特殊字符(称为元字符,如 “+”, “*”,以及 “?”)。正则表达式使用单个字符串来描述或匹配一系列匹配某个句法规则的字符串,表达对字符串的一种过滤逻辑,例如检索、替换符合规则的文本。在Python中,使用re标准库来调用正则表达式处理函数。

re.match

match函数用于匹配字符串,特点是匹配项必须位于字符串的起始位置,具体用法如下。

import re
a = 'Hello,this is a message'
b = re.match('Hello', a)
c = re.match('message', a)
print(b)
print(c)
print(re.match('Hello', a).span())
# 注意区分大小写
print(re.match('hello', a))
<re.Match object; span=(0, 5), match='Hello'>
None
(0, 5)
None

 返回值是一个包含字符串位置索引的元组或者是None。

re.search

search函数会搜索整个字符串,不论匹配项是否在开头,只要字符串中包含匹配项就会返回元组。

import re
a = 'Hello,this is a message'
b = re.search('Hello', a)
c = re.search('message', a)
print(b.span())
print(c.span())
(0, 5)
(16, 23)

re.sub 

sub函数用于文本替换,如果设置替换内容为空则可以起到删除的效果。

import re
name = "赵钱孙李赵钱孙李赵"# 替换作用
name1 = re.sub('李', "周", name)
print(name1)# 删除作用
name2 = re.sub('赵', "", name)
print(name2)# 选定替换次数,默认值为0表示替换所有
name3 = re.sub('赵', "周", name, count=2)
print(name3)
赵钱孙周赵钱孙周赵
钱孙李钱孙李
周钱孙李周钱孙李赵

模式语法

上述函数都是对某一确切字符串进行操作,那么如果想要匹配转义字符或者数字,又该怎么做呢?这就要请出正则表达式中的语法部分,也就是文章开头提到的特定字符了。

^匹配字符串的开头
$匹配字符串的末尾。
.匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。
[...]用来表示一组字符,单独列出:[amk] 匹配 'a','m'或'k'
[^...]不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
re*匹配0个或多个的表达式。
re+匹配1个或多个的表达式。
re?匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
re{ n}匹配n个前面表达式。例如,"o{2}"不能匹配"Bob"中的"o",但是能匹配"food"中的两个o。
re{ n,}精确匹配n个前面表达式。例如,"o{2,}"不能匹配"Bob"中的"o",但能匹配"foooood"中的所有o。"o{1,}"等价于"o+"。"o{0,}"则等价于"o*"。
re{ n, m}匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
a| b匹配a或b
(re)匹配括号内的表达式,也表示一个组
(?imx)正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中的区域。
(?-imx)正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。
(?: re)类似 (...), 但是不表示一个组
(?imx: re)在括号中使用i, m, 或 x 可选标志
(?-imx: re)在括号中不使用i, m, 或 x 可选标志
(?#...)注释.
(?= re)前向肯定界定符。如果所含正则表达式,以 ... 表示,在当前位置成功匹配时成功,否则失败。但一旦所含表达式已经尝试,匹配引擎根本没有提高;模式的剩余部分还要尝试界定符的右边。
(?! re)前向否定界定符。与肯定界定符相反;当所含表达式不能在字符串当前位置匹配时成功。
(?> re)匹配的独立模式,省去回溯。
\w匹配数字字母下划线
\W匹配非数字字母下划线
\s匹配任意空白字符,等价于 [\t\n\r\f]。
\S匹配任意非空字符
\d匹配任意数字,等价于 [0-9]。
\D匹配任意非数字
\A匹配字符串开始
\Z匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串。
\z匹配字符串结束
\G匹配最后匹配完成的位置。
\b匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
\B匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
\n, \t, 等。匹配一个换行符。匹配一个制表符, 等
\1...\9匹配第n个分组的内容。
\10匹配第n个分组的内容,如果它经匹配。否则指的是八进制字符码的表达式。

笔者这张表引用自Python3 正则表达式 ,下面是相应的代码举例,使用findall函数返回所有匹配项,\d+代表匹配项为连贯数字。

import re#第一种写法,匹配多个数字
a = re.findall('\d+', 'Alan33cat6hurt')
print(a)# 第二种写法
b = re.compile('\d')
# compile用来创建一个正则表达式
c = b.findall('Alan33cat6hurt')
print(b)
print(c)
# 可以设置搜索匹配项的范围
d = b.findall('Alan33cat6hurt', 0, 5)
print(d)
['33', '6']
re.compile('\\d')
['3', '3', '6']
['3']

以上就是Python中正则表达式的相关用法,笔者对这方面了解也不是很多,欢迎大家查漏补缺。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/653308.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RK3568平台 of 操作函数获取属性

一.of 操作函数获取属性 of_find_property 函数&#xff0c;用于在设备树中查找节点 下具有指定名称的属性。 struct property *of_find_property(const struct device_node *np, const char *name, int*lenp)np: 要查找的节点。 name: 要查找的属性的属性名。 lenp: 一个指…

Android 基础技术——列表卡顿问题如何分析解决

笔者希望做一个系列&#xff0c;整理 Android 基础技术&#xff0c;本章是关于列表卡顿问题如何分析解决 onBindViewHolder 优化 是否有耗时操作、重复创建对象、设置监听器、findViewByID、局部的动画对象等操作 是否存在内存泄漏 发生内存泄露&#xff0c;会导致一些不再使用…

游戏开发丨基于Tkinter的扫雷小游戏

文章目录 写在前面扫雷小游戏需求分析程序设计程序分析运行结果系列文章写在后面 写在前面 本期内容 基于tkinter的扫雷小游戏 所需环境 pythonpycharm或anaconda 下载地址 https://download.csdn.net/download/m0_68111267/88790713 扫雷小游戏 扫雷是一款广为人知的单…

RabbitMQ“延时队列“

1.RabbitMQ"延时队列" 延迟队列存储的对象是对应的延迟消息&#xff0c;所谓“延迟消息”是指当消息被发送以后&#xff0c;并不想让消费者立刻拿到消息&#xff0c;而是等待特定时间后&#xff0c;消费者才能拿到这个消息进行消费 注意RabbitMQ并没有延时队列慨念,…

【ArcGIS微课1000例】0097:栅格重采样(以数字高程模型dem为例)

Contents 1. 最邻近法(Nearest Neighbor)2. 双线性内插法(Bilinear Interpolation)3. 三次卷积法(Cubic Convolution)4. ArcGIS重采样工具(Resample)5. 注意事项栅格/影像数据进行配准或纠正、投影等几何变换后,像元中心位置通常会发生变化,其在输入栅格中的位置不一…

OpenCV-29 自适应阈值二值化

一、引入 在前面的部分我们使用的是全局阈值&#xff0c;整幅图像采用同一个数作为阈值。当时这种方法并不适应于所有情况。尤其是当同一幅图像上的不同部分具有不同的亮度时。这种情况下我们需要采用自适应阈值。此时的阈值时根据图像上的每一个小区域计算与其对应的阈值。因此…

com.spring4all:swagger-spring-boot-starter:1.7.1.RELEASE导致,项目启动出错

Springboot 启动出错如下&#xff1a; Exception in thread "main" java.lang.NoSuchMethodError: org.springframework.util.Assert.isInstanceOf(Ljava/lang/Class;Ljava/lang/Object;Ljava/util/function/Supplier;)Vat org.springframework.boot.logging.logbac…

【幻兽帕鲁】开服务器,高性能高带宽(100mbps),免费!!!【学生党强推】

【幻兽帕鲁】开服务器&#xff0c;高性能高带宽&#xff08;100mbps&#xff09;&#xff0c;免费&#xff01;&#xff01;&#xff01;【学生党强推】 教程相关视频地址&#xff1a;https://www.bilibili.com/video/BV16e411Y7Fd/ 目前幻兽帕鲁开服务器有以下几套比较性价比的…

Python编程技巧 – 函数参数

Python编程技巧 – 函数参数 Python Programming Skills - Functional Parameters 1. 函数的定义 函数有简明扼要的定义。 函数是一个代码块&#xff0c;仅在调用时运行。可以将数据&#xff08;称为参数&#xff09;传递到函数中。函数可以返回数据作为结果。 2. 函数的结…

【Vue】为什么Vue3使用Proxy代替defineProperty?

先来看看 Vue2 中 defineProperty 来操作数据&#xff1a; const obj {a: 1,b: 2,c: {a: 1,b: 2} } function _isObject(v) {return typeof v object && v ! null; } function observe(object) {for (let key in object) {let v object[key];if (_isObject(v)) {ob…

研发日记,Matlab/Simulink避坑指南(九)——可变数组应用Bug

文章目录 前言 背景介绍 问题描述 分析排查 解决方案 总结归纳 前言 见《研发日记&#xff0c;Matlab/Simulink避坑指南(四)——transpose()转置函数Bug》 见《研发日记&#xff0c;Matlab/Simulink避坑指南(五)——CAN解包 DLC Bug》 见《研发日记&#xff0c;Matlab/Si…

Hive之set参数大全-19

指定用于计算列的唯一值数&#xff08;NDV&#xff0c;即基数&#xff09;的算法 在 Hive 中&#xff0c;hive.stats.ndv.algo 是一个配置参数&#xff0c;用于指定用于计算列的唯一值数&#xff08;NDV&#xff0c;即基数&#xff09;的算法。以下是有关该参数的一些解释&…

计算机网络之ARP协议

ARP&#xff08;地址解析协议&#xff0c;Address Resolution Protocol&#xff09;是一种用于在网络中解析或确定目标主机的物理地址&#xff08;如以太网MAC地址&#xff09;的网络协议。ARP主要用于IPv4网络&#xff0c;它使得设备能夠在知道目标设备的IP地址的情况下找到其…

qemu + vscode图形化调试linux kernel

一、背景 使用命令行连接gdb 在调试时&#xff0c;虽然可以通过tui enable 显示源码&#xff0c;但还是存在设置断点麻烦&#xff08;需要对着源码设置&#xff09;&#xff0c;terminal显示代码不方便&#xff0c;不利于我们学习&#xff1b;另外在gdb 下p命令显示结构体内容…

重构改善既有代码的设计-学习(六):处理继承关系

1、函数上移&#xff08;Pull Up Method&#xff09; 无论何时&#xff0c;只要系统内出现重复&#xff0c;你就会面临“修改其中一个却未能修改另一个”的风险。通常&#xff0c;找出重复也有一定的难度。 所以&#xff0c;某个函数在各个子类中的函数体都相同&#xff08;它们…

Pandas--数据结构 - Series(3)

Pandas Series 类似表格中的一个列&#xff08;column&#xff09;&#xff0c;类似于一维数组&#xff0c;可以保存任何数据类型。 Series 特点&#xff1a; 索引&#xff1a; 每个 Series 都有一个索引&#xff0c;它可以是整数、字符串、日期等类型。如果没有显式指定索引&…

Android Automotive:在路上释放 Android 操作系统的力量

Android Automotive&#xff1a;在路上释放 Android 操作系统的力量 Android 在汽车行业的历程车载信息娱乐系统 (IVI) 的演变汽车中的 Android&#xff1a;演变和进步Android 汽车操作系统的崛起Polestar 2&#xff1a;开创 Android 汽车体验Android 开源项目 (AOSP) 及其他项…

数据结构 练习题1答案版

1. 含有3个结点的二叉树的树形共有&#xff08;&#xff09;种。 A.2 B&#xff0e;5 C.6 D&#xff0e;7 2. 一棵二叉树共有25个结点,其中5个是叶子结点,则度为1的结点数为( ) A&#xff0e;16 B&#xff0e;10 C&#xff0e;6 D&#xff0e;4 3. 某二叉树有5个度为…

华为三层交换机与防火墙对接配置上网示例

三层交换机与防火墙对接上网配置示例 组网图形 图1 三层交换机与防火墙对接上网组网图 三层交换机简介配置注意事项组网需求配置思路操作步骤配置文件 三层交换机简介 三层交换机是具有路由功能的交换机&#xff0c;由于路由属于OSI模型中第三层网络层的功能&#xff0c;所以…

mac安装mysql的8.0设置面板启动不了

1、前言 记得之前安装mysql5.7的时候&#xff0c;是可以直接从设置里面的mysql面板启动的&#xff0c;但是到了mysql8.0之后就启动不了了&#xff0c;这个问题不知道是版本问题还是我换了m系列芯片的mysql导致的&#xff0c;之前很多次都启动不了&#xff0c;这次搞了下&#x…