3.13 正则

3.13.1基本概念

正则：处理字符串的一种规则。
正则匹配：验证当前字符串是否符合该规则的子串。
正则捕获：获取符合规则的字符。
正则定义

正则字面量：var reg=/\d/g; (\d 表示元字符，/表示修饰符)
new创建：var reg2 = new RegExp("\\d","g");

使用变量拼接正则

var name = "jaqi"
// 'This note was written by <span style="A;">jaqi</span>'
"This note was written by jaqi".replace(new RegExp(`\\b(${name})\\b`,'g'),`<span style="color:bule;">$1</span>`)

new RegExp的正则对象连续使用问题

// 在连续使用的时候lastIndex会指向前一个匹配元素的结尾
var urlReg = new RegExp(/^\d+$/g)
console.log(urlReg.lastIndex) // 0
console.log(urlReg.test("123456")) // true
console.log(urlReg.lastIndex) // 6
console.log(urlReg.test("123456"))  // false

// 解决方案 每次使用的时候重置lastIndex
var urlReg = new RegExp(/^\d+$/g)
urlReg.lastIndex=0
console.log(urlReg.lastIndex) // 0
console.log(urlReg.test("123456")) // true
urlReg.lastIndex=0
console.log(urlReg.lastIndex) // 0
console.log(urlReg.test("1234567")) // true

3.13.2正则的组成

修饰符：

/后的表示修饰符

g全局匹配

y匹配连续满足条件的项
每次匹配的起始位置字符必须满足匹配条件，否则不能连续执行，通常配合lastIndex使用

i忽略大小写

m多行匹配

u匹配unicode(utf-8)主要用于多字节匹配比如汉字、特殊符号等
主要用于多字节匹配比如汉字、特殊符号等

s忽略换行符

元字符：

/ /中的内容

特殊的元字符

\d 0~9任意一个数字
\D 非0~9之间的任意字符
\w 字母、数字或者下划线
\W 非字母、数字下划线
\s 匹配任意一个空白字符（包括制表符tab键）
\S 匹配任意一个非空白字符（包括制表符tab键）
\b 单词边界（匹配单词的开始或结束位置）
\B 非单词边界（匹配不在单词开始或结束位置的位置）

// 匹配单词word
/\bword\b/.test('This is a word');    // true
/\bword\b/.test('This is a 2word2');    // false

// 匹配非单词word（word前后有其他字符的单词）
/\Bword\B/.test('This is a 2word2');    // true
/\Bword\B/.test('This is a word');    // false

\n 匹配一个换行符
\ 转义字符可以把一个普通字符转换成特殊字符，也可以把特殊的转成普通的 (\.小数点)
. 表示除了\n之外的任意字符
^ 以某个字符开头
$ 以某个字符结尾
a|b a或者b任意个(a, b, ab)

量词元字符

* 出现零到多次→{0, }
? 出现零到一次→{0, 1}
量词+? 禁止贪婪，捕获最少的内容

  `hdddd`.match(/hd{2,6}/)  //  hdddd
  `hdddd`.match(/hd{2,6}?/)  //  hdd

+ 出现一次到多次→{1，}
{m} 出现m次
{m,} 出现至少m次
{m,n} 出现m到n次

原子表`[]`

[abc] a或b或c任意个
[^abc] 除了a、b、c之外的
[a-z] a到z任意一个字母（[0-9]→\d）
[^a-z] a到z之外的任意字符

TIP

原子表[]内不会对特殊的元字符转译
匹配所有[\s\S]或[^]

原子组`()`

\n原子组号：从左到右一个括号表示一组\1、\2、\3、\4，如果是嵌套的，先算里面的然后在继续算后面的

// \1 代表第一个原子组 (h[1-6])
`<h1>awdawd</h1>`.match(/<(h[1-6])>([\s\S]*)<\/\1>/i)

TIP

使用原子组编号所匹配的一定是第一个原子组匹配的值

// 原子组匹配的h1 那么通过原子组编号匹配的也是h1 所以返回null
`<h1>awdawd</h2>`.match(/<(h[1-6])>([\s\S]*)<\/\1>/i)

$n用于在replace中获取原子组捕获的值：$原子组编号$1、$2、$3、$4

// `$2`即是awdawd  <p>awdawd</p>
`<h1>awdawd</h1>`.replace(/<(h[1-6])>([\s\S]*)<\/\1>/i,`<p>$2</p>`)

(?:)不记录组编号捕获的值

// `$2`无效 直接返回字符串 '<p>$2</p>'
`<h1>awdawd</h1>`.replace(/<(h[1-6])>(?:[\s\S]*)<\/\1>/i,`<p>$2</p>`)

?<name>原子组编号别名

`<h1>awdawd</h1>`.replace(/<(h[1-6])>(?<nickname>[\s\S]*)<\/\1>/i,`<p>$<nickname></p>`)

(?=)前瞻*ES6新增

// a后面是5的a
'1a2a3a4a5a6a'.replace(/a(?=5)/,'替换'); //  1a2a3a4替换5a6a
// a后面是不是5的a
'1a2a3a4a5a6a'.replace(/a(?!5)/g,'替换'); // '1替换2替换3替换4a5替换6替换'

(?<=)后瞻*ES2018新增，除chrome以外大部分浏览器都不支持，谨慎使用！

// a前面是5的啊
'1a2a3a4a5a6a'.replace(/(?<=5)a/,'替换'); //  1a2a3a4a5替换6a  

// a前面不是是5的啊
'1a2a3a4a5a6a'.replace(/(?<！5)a/,'替换'); //  1替换2替换3替换4替换5a6替换 

// 替换电话号码中级4位
'13800001110'.replace(/(?<=\d{3})(\d{4})/,'****'); // 138****1110

(?!)反向预查

// 英文后面不是数字
'jaqi13800001110yakamoz'.match(/[a-z]+(?!\d+)$/i); // yakamoz

3.13.3正则常用方法

正则相关方法

test正则检测,返回true/false

var reg = new RegExp(/\s/);
reg.test(str)

exec返回全部符合的元素数组（忽略/g），索引0为全部内容，1....99 为相应原子组匹配的内容

var reg = new RegExp(/\s/);
reg.exec(str)

字符串相关方法

match返回全部符合的元素数组，索引0为全部内容，1....99 为相应原子组匹配的内容 match如果不设置/g全局匹配，则返回原子组内容，否则只返回匹配的完整内容
matchAll返回全部符合元素的迭代对象*ES2020(ES11)新增
search返回符合元素的索引（忽略/g）
replace函数的返回值替换符合正则的元素详见3.9.1
split根据指定字符串对数组进行拆分

`2020-09/12`.split(/[-\/]/); //通过逗号分割，转成数组

eval
lastIndex下次匹配的起始位置(只有全局匹配才有效)

var str="The rain in Spain stays mainly in the plain";
var reg=/ain/g;

while (reg.test(str)==true) 
{
	document.write("'ain' found. Index now at: "+reg.lastIndex);
}

/**
 * 'ain' found. Index now at: 8
 * 'ain' found. Index now at: 17
 * 'ain' found. Index now at: 28
 * 'ain' found. Index now at: 43
 * /

3.13.4事例：

以m开头至少2个n 最多5个n

var reg = /^mn{2,5}$/;

6个5：

var reg = /^5{6}$/;

邮编：

var reg = /^[0-9]{6}$/;

判断用户名字母数字下划线长度范围6~16：

var reg = /^\w{6,16}$/;

判断用户名字母数字下划线不能以数字开头长度范围6~16：

var reg = /^[a-zA-Z_]\w{5,15}$/;

至少6位密码

var reg = /^.{6,}$/；

要求输入网址必须是www.sina.com

var reg = /^www\.sina\.com$/;/

要求输入 8+9：

var reg = /^8\+9$/;//

手机号码以13开头或以15开头：

var reg = /^1[35]\d{9}$/;  
//或
var reg = /^1(3|5)\d{9}$/;
//或
var reg = /^(13|15)\d{9}$/;

请输入汉字（unicode范围）：

var reg = /^[\u4e00-\u9fa5]+$/;

18-65：

var reg = /^((1[89])|([2-5][0-9])|(6[0-5]))$/;

邮箱：用户名是数字字母下划线 —

var reg = /^[\w-]+@(\w+\.)+\w+/;

书名号里面的标题

/《([^《|》]*)》/

(〔〕)查询法规标题

/[（\(][a-zA-Z0-9\u4e00-\u9fa5]*?〔{1}.*?〕{1}[a-zA-Z0-9\u4e00-\u9fa5]*?[）\)]/

多字节匹配

/[αβ]/gu

匹配各国文字

/\p{sc=Han}/gu

注意：

中括号里面的字符绝大多数是普通的字符
中括号出现的两位数不是数学的两位数：[18-65]表示1或者8到6或者5

1.2 html元素

第二章：CSS

第三章：JavaScript

第六章：vue.js

第八章：小程序

第九章：React

3.13 正则

3.13.1基本概念

3.13.2正则的组成

修饰符：

元字符：

特殊的元字符

量词元字符

原子表`[]`

原子组`()`

3.13.3正则常用方法

正则相关方法

字符串相关方法

3.13.4事例：

1.2 html元素

3.13 正则 ​

3.13.1基本概念 ​

3.13.2正则的组成 ​

修饰符： ​

元字符： ​

特殊的元字符 ​

量词元字符 ​

原子表[] ​

原子组() ​

3.13.3正则常用方法 ​

正则相关方法 ​

字符串相关方法 ​

3.13.4事例： ​

3.13 正则

3.13.1基本概念

3.13.2正则的组成

修饰符：

元字符：

特殊的元字符

量词元字符

原子表`[]`

原子组`()`

3.13.3正则常用方法

正则相关方法

字符串相关方法

3.13.4事例：