掌握正则表达式_模式匹配的艺术

当然,以下是《掌握正则表达式:模式匹配的艺术》文章内容,使用 Java 正则表达式,并包含丰富的代码示例:

1. 引言

1.1 正则表达式的定义与历史

正则表达式(Regular Expression,简称 regex 或 regexp)是一种用于描述文本模式的强大工具。它最初由数学家 Stephen Kleene 在 20 世纪 50 年代提出,后来被广泛应用于计算机科学领域,尤其是在文本处理和模式匹配中。

1.2 学习正则表达式的重要性

正则表达式在各种编程语言和工具中都有广泛应用,如文本编辑器、命令行工具、数据库查询、Web 开发等。掌握正则表达式可以帮助你更高效地处理文本数据,编写简洁且功能强大的代码。

2. 基础概念

2.1 正则表达式的语法元素

字符类

字符类用于匹配特定类型的字符。常见的字符类包括:

  • .:匹配任意单个字符(除换行符外)
  • \d:匹配数字 [0-9]
  • \w:匹配字母、数字和下划线 [a-zA-Z0-9_]
  • \s:匹配空白字符(空格、制表符、换行符等)

量词

量词用于指定前面的字符或组出现的次数:

  • *:匹配前面的字符零次或多次
  • +:匹配前面的字符一次或多次
  • ?:匹配前面的字符零次或一次
  • {n}:匹配前面的字符恰好 n 次
  • {n,}:匹配前面的字符至少 n 次
  • {n,m}:匹配前面的字符至少 n 次,最多 m 次

锚点

锚点用于指定匹配的位置:

  • ^:匹配字符串的开头
  • $:匹配字符串的结尾

分组与捕获

分组用于将多个字符组合在一起,捕获用于提取匹配的部分:

  • ():分组并捕获匹配的内容
  • (?:):非捕获分组,只分组不捕获

2.2 常见元字符及其作用

元字符是具有特殊含义的字符,如 .*+ 等。它们可以用来构建复杂的匹配规则。例如,.* 表示匹配任意数量的任意字符。

3. 构建简单的正则表达式

匹配固定字符串

要匹配一个固定的字符串,可以直接使用该字符串本身作为正则表达式。例如,hello 匹配字符串 “hello”。

代码示例

import java.util.regex.*;public class FixedStringExample {public static void main(String[] args) {String text = "hello world";String regex = "hello";Pattern pattern = Pattern.compile(regex);Matcher matcher = pattern.matcher(text);if (matcher.find()) {System.out.println("Match found: " + matcher.group());} else {System.out.println("No match found.");}}
}

使用字符类进行匹配

字符类可以让你匹配一组字符中的任意一个。例如,[aeiou] 匹配任意一个元音字母。

代码示例

import java.util.regex.*;public class CharacterClassExample {public static void main(String[] args) {String text = "hello world";String regex = "[aeiou]";Pattern pattern = Pattern.compile(regex);Matcher matcher = pattern.matcher(text);while (matcher.find()) {System.out.println("Vowel found: " + matcher.group());}}
}

利用量词简化表达式

量词可以简化重复字符的匹配。例如,\d{3}-\d{2}-\d{4} 可以匹配美国的社会安全号码格式(如 123-45-6789)。

代码示例

import java.util.regex.*;public class QuantifierExample {public static void main(String[] args) {String text = "123-45-6789"

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/69657.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在CAD中插入图块后为什么看不到?怎么解决?

按照正确操作插入图块,但图纸上不显示新插入的图块,这是为什么? 原因可能是大家插入的图块太小,导致看不到,显示成一个点,所以大家插入图块的时候记得根据图纸大小,将比例改大一些就可以啦✌️…

【CMAEL多智能体框架】第一节 环境搭建及简单应用(构建一个鲜花选购智能体)

第一节 环境搭建 文章目录 第一节 环境搭建前言一、安装二、获取API1. 使用熟悉的API代理平台2.设置不使用明文存放API 三 、具体应用进阶任务 总结 前言 CAMEL Multi-Agent是一个开源的、灵活的框架,它提供了一套完整的工具和库,用于构建和模拟多智能体…

Flink-序列化

一、概述 几乎每个Flink作业都必须在其运算符之间交换数据,由于这些记录不仅可以发送到同一JVM中的另一个实例,还可以发送到单独的进程,因此需要先将记录序列化为字节。类似地,Flink的堆外状态后端基于本地嵌入式RocksDB实例&…

夸克网盘多链接批量保存,自动同步更新,批量分享

最近夸克网盘有点火,好多资源都上夸克网盘了,做了一个夸克网盘的批量化程序,已经打包好了,不用配置代码环境就能用 夸克网盘工具:https://pan.quark.cn/s/c22f3451a6ab 百度网盘工具:https://pan.quark.cn…

分享一款免费的AI大模型字幕工具,支持语音识别、字幕断句、优化、翻译、视频合成等全流程自动处理(支持抖音、B站、油管等国内外多平台视频下载与处理)

文章目录 📖 介绍 📖🏡 演示环境 🏡📒 AI字幕工具:全平台视频创作的福音 📒💡 功能与特点:一网打尽⚙️ 使用⚓️ 相关链接 ⚓️📖 介绍 📖 还在为视频加字幕抓狂?🤯 平台限制多,操作又繁琐?别再挠破头皮啦!今天给大家分享的这款AI神器,简直是视频创…

使用DeepSeek和Kimi快速自动生成PPT

目录 步骤1:在DeepSeek中生成要制作的PPT主要大纲内容。 (1)在DeepSeek网页端生成 (2)在本地部署DeepSeek后,使用chatBox生成PPT内容 步骤2:将DeepSeek成的PPT内容复制到Kimi中 步骤3&…

Wiki文档转换为Word技术

一、技术背景与目标 Wiki系统导出的文档通常以HTML格式存在,且内容分散在多个文件中,每个页面对应一个HTML文件。然而,Microsoft Word(Word)在处理HTML文件时,仅支持单个HTML文件的导入。因此,为了将Wiki导出的内容转换为Word可识别的格式,必须将分散的HTML文件整合为一…

第41天:Web开发-JS应用微信小程序源码架构编译预览逆向调试嵌套资产代码审计

#知识点 1、安全开发-微信小程序-搭建&开发&架构&安全 2、安全开发-微信小程序-编译调试&反编译&泄露 一、小程序创建(了解即可) 1、下载微信开发者工具 2、创建小程序模版引用 https://developers.weixin.qq.com/miniprogram/dev/d…

Arduino 第十一章:温度传感器

Arduino 第十一章:LM35 温度传感器 一、LM35 简介 LM35 是美国国家半导体公司(现德州仪器)生产的一款精密集成电路温度传感器。与基于热力学原理的传统温度传感器不同,LM35 能直接将温度转换为电压输出,且输出电压与…

Oracle常用导元数据方法

1 说明 前两天领导发邮件要求导出O库一批表和索引的ddl语句做国产化测试,涉及6个系统,6千多张表,还好涉及的用户并不多,要不然很麻烦。 如此大费周折原因,是某国产库无法做元数据迁移。。。额,只能我手动导…

【案例教程】无人机生态环境监测、图像处理与GIS数据分析综合实践技术应用

专题一、无人机航拍基本流程、航线规划与飞行实践 1.无人机行业应用概况 2.无人机遥感监测简介 3.无人机与传感器类型 4.无人机航线规划设计(谷歌地球软件的使用) 5.无人机飞行软件操作(DJI App设置实践视频) 6.无人机航拍一…

2022java面试总结,1000道(集合+JVM+并发编程+Spring+Mybatis)的Java高频面试题

1、面试题模块汇总 面试题包括以下十九个模块: Java 基础、容器、多线程、反射、对象拷贝、Java Web 模块、异常、网络、设计模式、Spring/Spring MVC、Spring Boot/Spring Cloud、Hibernate、Mybatis、RabbitMQ、Kafka、Zookeeper、MySql、Redis、JVM 。如下图所示…

点云配准网络

【论文笔记】点云配准网络 PCRNet: Point Cloud Registration Network using PointNet Encoding 2019_pcr-net-CSDN博客 【点云配准】【深度学习】Windows11下PCRNet代码Pytorch实现与源码讲解-CSDN博客 【点云配准】【深度学习】Windows11下GCNet代码Pytorch实现与源码讲解_…

Curser2_解除机器码限制

# Curser1_无限白嫖试用次数 文末有所需工具下载地址 Cursor Device ID Changer 一个用于修改 Cursor 编辑器设备 ID 的跨平台工具集。当遇到设备 ID 锁定问题时,可用于重置设备标识。 功能特性 ✨ 支持 Windows 和 macOS 系统🔄 自动生成符合格式的…

carbon 加入 GitCode:Golang 时间处理的 “瑞士军刀”

在 Golang 的开发生态中,时间处理领域长期存在着诸多挑战。高效、精准的时间处理对于各类软件应用的稳定运行与功能拓展至关重要。近日,carbon 正式加入 GitCode,为 Golang 开发者带来一款强大且便捷的时间处理利器,助力项目开发迈…

算法学习--链表

引言:为什么进行链表的学习? 考察能力独特:链表能很好地考察应聘者对指针操作、内存管理的理解和运用能力,还能检验代码的鲁棒性,比如处理链表的插入、删除操作时对边界条件的处理。数据结构基础:链表是很多…

域名劫持原理与实践

了解域名及域名劫持 由于点分十进制的IP地址难于记忆,便出现了域名。由于网络传输中最终还是基于IP,所以必须通过一种机制将IP和域名一一对应起来,这便是DNS。全球总共有13台根域名服务器。 域名劫持是互联网攻击中常见的一种攻击方式&…

【论文翻译】DeepSeek-V3论文翻译——DeepSeek-V3 Technical Report——第二部分:(训练硬件)基础设施

论文原文链接:DeepSeek-V3/DeepSeek_V3.pdf at main deepseek-ai/DeepSeek-V3 GitHub 特别声明,本文不做任何商业用途,仅作为个人学习相关论文的翻译记录。本文对原文内容直译,一切以论文原文内容为准,对原文作者表示…

动起来的选择:快走还是慢跑?

文章目录 快走的基础认知慢跑的基础认知运动强度剖析能量消耗对比身体锻炼效果 快走的基础认知 定义 快走(Brisk Walking)是一种介于普通行走与跑步之间的有氧运动形式,强调通过加快步频和优化步伐效率来提升运动强度,同时保持双脚…

MapReduce到底是个啥?

在聊 MapReduce 之前不妨先看个例子:假设某短视频平台日活用户大约在7000万左右,若平均每一个用户产生3条行为日志:点赞、转发、收藏;这样就是两亿条行为日志,再假设每条日志大小为100个字节,那么一天就会产…