ES6 正则的扩展

1. RegExp构造函数

ES5中,RegExp构造函数的参数:

  1. 参数是字符串,这时第二个参数表示正则表达式的修饰符(flag)
  2. 参数是一个正则表示式,这时会返回一个原有正则表达式的拷贝。但是,ES5不允许此时使用第二个参数,添加修饰符,否则会报错。

ES6改变了这种行为。如果RegExp构造函数第一个参数是一个正则对象,那么可以使用第二个参数指定修饰符。而且,返回的正则表达式会忽略原有的正则表达式的修饰符,只使用新指定的修饰符。

2. 字符串的正则表达式

字符串对象共有4个方法,可以使用正则表达式:match()、replace()、search()和split()。

ES6将这4个方法,在语言内部全部调用RegExp的实例方法,从而做到所有与正则相关的方法,全都定义在RegExp对象上。

String.prototype.match 调用 RegExp.prototype[Symbol.match]
String.prototype.replace 调用 RegExp.prototype[Symbol.replace]
String.prototype.search 调用 RegExp.prototype[Symbol.search]
String.prototype.split 调用 RegExp.prototype[Symbol.split]

3. u修饰符

ES6对正则表达式添加了u修饰符,含义为“Unicode模式”,用来正确处理大于\uFFFF的Unicode字符。

也就是说,会正确处理四个字节的UTF-16编码。对于码点大于0xFFFF的Unicode字符,点字符不能识别,必须加上u修饰符。

ES6新增了使用大括号表示Unicode字符,这种表示法在正则表达式中必须加上u修饰符,才能识别。

/\u{61}/.test('a') // false
/\u{61}/u.test('a') // true
/\u{20BB7}/u.test('?') // true
1.点字符

点(.)字符在正则表达式中,含义是除了换行符以外的任意单个字符。对于码点大于0xFFFF的Unicode字符,点字符不能识别,必须加上u修饰符。

var s = '';  /^.$/.test(s) // false  
/^.$/u.test(s) // true  

上面代码表示,如果不添加u修饰符,正则表达式就会认为字符串为两个字符,从而匹配失败。

2. 量词

使用u修饰符后,所有量词都会正确识别码点大于0xFFFF的Unicode字符。

/a{2}/.test('aa') // true  
/a{2}/u.test('aa') // true  
/ {2}/.test('  ') // false  
/ {2}/u.test('  ') // true  

另外,只有在使用u修饰符的情况下,Unicode表达式当中的大括号才会被正确解读,否则会被解读为量词。

/^\u{3}$/.test('uuu') // true  

上面代码中,由于正则表达式没有u修饰符,所以大括号被解读为量词。加上u修饰符,就会被解读为Unicode表达式。

3. 预定义模式

u修饰符也影响到预定义模式,能否正确识别码点大于0xFFFF的Unicode字符。

\S是预定义模式,匹配所有不是空格的字符。只有加了u修饰符,它才能正确匹配码点大于0xFFFF的Unicode字符。

利用这一点,可以写出一个正确返回字符串长度的函数。

function codePointLength(text) {var result = text.match(/[\s\S]/gu);return result ? result.length : 0;
}var s = '??';s.length // 4
codePointLength(s) // 2
4. i修饰符

有些Unicode字符的编码不同,但是字型很相近,比如,\u004B与\u212A都是大写的K。

/[a-z]/i.test('\u212A') // false  
/[a-z]/iu.test('\u212A') // true  

上面代码中,不加u修饰符,就无法识别非规范的K字符。

4. y修饰符

除了u修饰符,ES6还为正则表达式添加了y修饰符,叫做“粘连”(sticky)修饰符。

y修饰符的作用与g修饰符类似,也是全局匹配,后一次匹配都从上一次匹配成功的下一个位置开始。

不同之处在于,g修饰符只要剩余位置中存在匹配就可,而y修饰符确保匹配必须从剩余的第一个位置开始,这也就是“粘连”的涵义。

var s = 'aaa_aa_a';  
var r1 = /a+/g;  
var r2 = /a+/y;  r1.exec(s) // ["aaa"]  
r2.exec(s) // ["aaa"]  r1.exec(s) // ["aa"]  
r2.exec(s) // null  

上面代码有两个正则表达式,一个使用g修饰符,另一个使用y修饰符。这两个正则表达式各执行了两次,第一次执行的时候,两者行为相同,剩余字符串都是_aa_a。由于g修饰没有位置要求,所以第二次执行会返回结果,而y修饰符要求匹配必须从头部开始,所以返回null。

如果改一下正则表达式,保证每次都能头部匹配,y修饰符就会返回结果了。

var s = 'aaa_aa_a';  
var r = /a+_/y;  r.exec(s) // ["aaa_"]  
r.exec(s) // ["aa_"]  

上面代码每次匹配,都是从剩余字符串的头部开始。

使用lastIndex属性,可以更好地说明y修饰符。

const REGEX = /a/g;  // 指定从2号位置(y)开始匹配  
REGEX.lastIndex = 2;  // 匹配成功  
const match = REGEX.exec('xaya');  // 在3号位置匹配成功  
match.index // 3  // 下一次匹配从4号位开始  
REGEX.lastIndex // 4  // 4号位开始匹配失败  
REGEX.exec('xaxa') // null  

上面代码中,lastIndex属性指定每次搜索的开始位置,g修饰符从这个位置开始向后搜索,直到发现匹配为止。

const REGEX = /a/y;  // 指定从2号位置开始匹配  
REGEX.lastIndex = 2;  // 不是粘连,匹配失败  
REGEX.exec('xaya') // null  // 指定从3号位置开始匹配  
REGEX.lastIndex = 3;  // 3号位置是粘连,匹配成功  
const match = REGEX.exec('xaxa');  
match.index // 3  
REGEX.lastIndex // 4  

y修饰符同样遵守lastIndex属性,但是要求必须在lastIndex指定的位置发现匹配。

进一步说,y修饰符号隐含了头部匹配的标志^。

/b/y.exec('aba')  
// null  

单单一个y修饰符对match方法,只能返回第一个匹配,必须与g修饰符联用,才能返回所有匹配。

5. sticky属性

表示是否设置了y修饰符

var r = /hello\d/y;
r.sticky // true

6. flags属性

ES6为正则表达式新增了flags属性,会返回正则表达式的修饰符。(和前面是一个逆向的过程)

7. RegExp.escape()

字符串必须转义,才能作为正则模式。已经有提议将这个需求标准化,作为RegExp对象的静态方法RegExp.escape()

function escapeRegExp(str) {return str.replace(/[\-\[\]\/\{\}\(\)\*\+\?\.\\\^\$\|]/g, '\\$&');
}let str = '/path/to/resource.html?search=query';
escapeRegExp(str)
// "\/path\/to\/resource\.html\?search=query"

转载于:https://www.cnblogs.com/huyuzhu/p/6486596.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/572693.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为荣耀笔记本linux系统怎么样,荣耀笔记本和华为笔记本有什么区别

以荣耀Magic Book Pro和华为matebook 14为例,其区别如下:1、屏幕:荣耀Magic Book Pro屏幕尺寸为16.1英寸,显示比例为16比9,分辨率为1920乘以1080,华为matebook 14屏幕尺寸为14英寸,显示比例3比2…

初始Angularjs2

一、为什么使用Angularjs2 Angularjs2全面使用了模块化、组件化的思想,它有如下的特性: 1)模块化 在ng2的应用中,所有的系统功能都是模块化的,开发者只需要按需导入模块化的好处在于可以当应用加载时,是按需…

linux中输入ls出现蓝色的点,linux上ls的蓝色太深,怎么处理

linux下ls的蓝色太深,怎么办?在linux下使用ls命令时,会将目录以蓝色显示。在某些显示器上,黑底蓝字,看起来相当费力,以至于我有时候不得不使用dir命令,全部显示成白色。先看一个图:看…

四色着色问题 c语言编程,数据结构-图着色问题

7-38 图着色问题 (25 分)图着色问题是一个著名的NP完全问题。给定无向图G(V,E),问可否用K种颜色为V中的每一个顶点分配一种颜色,使得不会有两个相邻顶点具有同一种颜色?但本题并不是要你解决这个着色问题,而是对给定的一种颜色分配…

HTML学习笔记4之第五章第六章

2017-03-02 完成第五章第六章的学习 第五章&#xff1a;为界面增加图像 浏览器处理图像的过程&#xff1a;先请求页面&#xff0c;若需要图片&#xff0c;在请求图片 图像的格式&#xff1a;JPEG&#xff0c;PNG&#xff0c;GIF&#xff0c;各自的特点和优势 内联元素<img&g…

c语言printf %llo,c++ - Printf疯狂了 - 堆栈内存溢出

你不能使用%d来打印long long 。 你必须使用%lld 。 (因此请使用"\\n%d %d | %lld %lld | %d %d"作为格式字符串。)特别是&#xff0c;显而易见的是&#xff0c;在“52 0 | 52 0”中&#xff0c;第一个52 0是a.rez &#xff0c;第二个52 0是b.rez (这些中的每一个都是…

js柯里化

function sum(x){console.log(x:x);var y function(x){ console.log(xx:x);console.log(y:y);return sum(xy) }y.toString y.valueOf function(){ return x; } console.log(yy:y);return y; } sum(1)(2)(3)(4);//10 转载于:https://www.cnblogs.com/yuri2016/p/6496486.ht…

用c语言随机获区100个整数,用rand() 函数去100 个随机的整数的有关问题

用rand() 函数去100 个随机的整数的问题int rand100 (((double) rand() / (double) RAND_MAX) * RANGE_MAX RANGE_MIN);你让 RANGE_MAX1&#xff1b;RANGE_MIN 0问题&#xff1a;1 rand() 返回的是 什么类型的数&#xff1f;2 (double) rand() / (double) RAND_MAX)&#x…

BZOJ 3697: 采药人的路径 [点分治] [我想上化学课]

传送门 题意&#xff1a; 路径有$-1,1$两种权值&#xff0c;求有多少路径满足权值和为$0$且有一个点将路径分成权值和为$0$的两段 第四节课本来想去上化学&#xff0c;然后快上课了这道题还没调出来.....可恶我想上化学 昨天两节语文课潸然的李煜讲座也没去听呜呜听说今天的语文…

c#语言规范所在文件夹,C#规范整理·语言要素

如有不理解&#xff0c;请留言&#xff0c;开始!1. 正确操作字符串拼接字符串一定要考虑使用 StringBuilder ,默认长度为16,实际看情况设置。StringBuilder本质&#xff1a; 是以非托管方式分配内存。同时StringFormat方法 内部也是使用StringBuilder进行字符串格式化。2. 使用…

Discuz常见小问题-如何取消登陆发帖验证码

1 正常情况下&#xff0c;用户点击登录之后&#xff0c;需要填写验证码 2 进入后台&#xff0c;点击防灌水&#xff0c;验证设置&#xff0c;然后下面的各个选项可以设置是否启用验证码。 转载于:https://www.cnblogs.com/acetaohai123/p/6504754.html

RC电路的充放过程C语言实现,RC串联电路的暂态过程基本原理介绍

RC串联电路的特点&#xff1a;由于有电容存在不能流过直流电流&#xff0c;电阻和电容都对电流存在阻碍作用&#xff0c;其总阻抗由电阻和容抗确定&#xff0c;总阻抗随频率变化而变化。RC 串联有一个转折频率&#xff1a;f01/2πR1C1当输入信号频率大于f0 时&#xff0c;整个 …

jvm 方法区

方法区在一个jvm实例的内部&#xff0c;类型信息被存储在一个称为方法区的内存逻辑区中。类型信息是由类加载器在类加载时从类文件中提取出来的。类(静态)变量也存储在方法区中。 jvm实现的设计者决定了类型信息的内部表现形式。如&#xff0c;多字节变量在类文件是以big-endia…

C语言1094题目,基于visual Studio2013解决C语言竞赛题之1094纵横图

/************************************************************************//* 二)程序设计⑴奇阶纵横图n2m1请见填写方法分析1)。 该程序在 数组23题已经完成⑵偶阶纵横图n2(2m1)时&#xff0c;算法分析是把方阵划成A、B、C、D四个小子阵&#xff0c;然后进行多次交换数字来…

c语言考试常考试卷,c语言面试最必考的十道试题,求职必看!!!

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼6、free()函数问&#xff1a;下面的程序会在用户输入’freeze’的时候出问题&#xff0c;而’zebra’则不会&#xff0c;为什么?#include int main(int argc, char *argv[]) {char *ptr (char*)malloc(10);if(NULL ptr){printf(…

Java 导出Excel

前台代码&#xff1a; View Code?12345678910111213141516171819202122232425262728293031323334353637383940414243444546<button class"btn btn-sm btn-success" type"submit" id"detailEp" onclick"return exportCheck(true);"…

android 使用动态的svg资源,在Android中使用SVG作为资源 – victor

victor在Android中使用SVG作为资源。使用这个插件&#xff0c;你可以为SVG定义源文件&#xff0c;它们将会自动在build中光栅化/导入&#xff0c;无需源代码。安装在build.gradle中添加:buildscript {repositories {jcenter()}dependencies {classpath com.trello:victor:0.3.0…

centOS改编码

http://jingyan.baidu.com/article/ab69b270de8b4f2ca7189f1d.html cd /rootvim .bashrcLANG"zh_CN.GBK" :wqsoure.bashrc转载于:https://www.cnblogs.com/finallyliuyu/p/6513587.html

android 键盘 自动消失,android 软键盘 回到键 消失事件 监听

弹出输入法 时 隐藏了 ‘底部状态栏’ 在按 物理 返回键 后&#xff0c; 软键盘消失后 恢复 ‘底部状态栏’public class ImageViewCareIME extends ImageView{public ImageViewCareIME(Context context){super(context);// TODO Auto-generated constructor stub}public stati…

java基础_变量

变量: 数据类型: 基本类型&#xff1a;short/byte(1byte)/char(2byte)-->int(4byte)-->long(8byte)-->float&#xff08;8byte&#xff09;-->double&#xff08;16byte,默认&#xff09;、boolean java变量 从本质上讲&#xff0c;变量其实是内存里面的一小块区域…