详解javascript 正则表达式之分组与前瞻匹配

mac2022-06-30 189

一.分组匹配：

1. 捕获性分组匹配 ()

var str1 = "holle word 123456 can 12s a 123 a"; var reg1 =/([a-z]+)\s(\d+)/; //不是全局模式，以() 分组，这里有两组，每一组都将匹配得到 var regg1 = /([a-z]+)\s(\d+)/g; //全局模式 g,以() 分组，这里有两组，每一组都将匹配得到 //res :非全局模式 console.log(reg1.exec(str1)); //exec()方法：["wold 123456","word","123456"] console.log(str1.match(reg1));//match()方法:["word 123456","word","123456"] console.log(RegExp.$1);//获取到第一个分组 ([a-z]+) 匹配的结果：word console.log(RegExp.$2);//获取到第一个分组 (\d+) 匹配的结果：123456 //res :全局模式 console.log(regg1.exec(str1)); //exec()方法：["wold 123456","word","123456"] console.log(str1.match(regg1));//match()方法:["word 123456","can 12","a 123"] console.log(RegExp.$1);//获取到第一个分组 ([a-z]+) 匹配的结果：a console.log(RegExp.$2);//获取到第一个分组 (\d+) 匹配的结果：123

分析：这个正则表达式匹配的是，至少一个字母，跟着一个空格，然后至少一个数字，非全局就是第一次匹配正确就不会再往后匹配了，

exec()方法提取的值是规定的，第一个值是正则表达式相匹配的文本,如上示例的"/([a-z]+)\s(\d+)/"，第2个值是第一个子表达式(即第一个分组),如上示例的"([a-z])"，以此类推。

即使是全局模式，exec()都不会全局匹配，循环调用exec()是唯一全局匹配的方式，所以你会发现上面使用exec()方法的结果是一样。

而 match 方法在全局模式的捕获性分组匹配，会对正则表达式全局匹配，但是不会对子表达式匹配(分组),所以你会发现上面str1.match(regg1) 的结果是不会单独以分组([a-z]+)字母或者分组(\d+)数字出现，而是全局匹配整一个正则，所以结果是[“word 123456”,“can 12”,“a 123”]。

match 方法在非全局模式的捕获性分组匹配中，会对正则表达式全局匹配，也会对子表达式匹配(分组)，所以你发现，str1.match(reg1)匹配的结果有单独分组的匹配，但是因为是非全局，所以第一次匹配正确就结束了，只有[“wold 123456”,“word”,“123456”]，“wold 123456” 是整个表达式匹配的结果，“word” 是第一个分组（[a-z]+）匹配的结果，“123456” 是第二分组(\d+) 匹配的结果。

$1,$2… 分别包含正则表达式中的相对应反向引用，在全局与非全局模式，如果结果集有多个，会以最后一次匹配的结果来算，如上面，全局模式，匹配一共有三个符合的，[“word 123456”,“can 12”,“a 123”]，那么就以最后一个"a 123"为所有分组得到的结果，第一个分组是([a-z]+) 匹配的是字母所以是a，第二个分组是数字(\d+),所以是123 ，以此类推，如果只出现一次，一次也是当最后一次，自然也是一样的分析，哈哈哈，有点多余。。。。

2. 非捕获性分组匹配 (? : )

var str1 = "holle word 123456 can 12s a 123 a"; var reg2 = /(?:[a-z]+)\s(?:\d+)/; var regg2 = /(?:[a-z]+)\s(?:\d+)/g; //res :非全局模式 console.log(reg2.exec(str1));// exec(): 直接匹配["wold 123456"], console.log(str1.match(reg2));//match()方法:["word 123456"] //res :全局模式 console.log(regg2.exec(str1));// exec(): 直接匹配["wold 123456"], console.log(str1.match(regg2));//match()方法:["word 123456","can 12","a 123"]

分析，和上面的捕获性分组匹配是一样的解析，只是不再匹配子表达式(分组)

二. 前瞻匹配：

1. 正向前瞻匹配： (?=表达式) 后面一定要匹配有什么

注意：前瞻分组匹配(?=表达式) 会作为匹配内容，不会作为匹配结果返回

//实例，提取以jpg类型的图片名称 var str2 = "ab.jpg,admin/12.gif,and.jpg"; var reg3 = /[^\\]\w+(?=\.jpg)/g; console.log(str2.match(reg3));//["ab", ",and"]

2. 反向前瞻匹配: (?!表达式) 后面一定不能要有什么

//示例：匹配连续a字母三个以上，且后面不能有数字 var str3 = "aaa12345,aaaadmin,aaaaaadd,dlala"; var reg4 = /a{3,}(?!\d+)/g; console.log(str3.match(reg4));//["aaaa","aaaaaa"] let s = 'adfa&am;d&ds'.replace(/&(?!amp;)/g,'哈') console.log(s) //adfa哈am;d&ds

参考链接1:https://www.jb51.net/article/141161.htm

参考链接2：https://segmentfault.com/a/1190000014981826

最新回复(0)