【第14期】正则表达式总结的几个关键概念-前端晚自修

历史

https://zh.wikipedia.org/wiki/正则表达式

几个重要概念

元字符：在正则中具有特殊语义的字符
- .：匹配除换行符以外的任意字符
- \w：匹配字母或数字或下划线
- \W：匹配不是字母、数字、下划线的字母
- \d：匹配数字，相当于[0-9]
- \D：匹配不是数字的字符
- \s：匹配任意不可见字符，包括空格、制表符、换行符等（ASCII码对照表）
- \S：匹配任意可见字符
- \b：匹配
- ^：匹配字符串的开始位置
- $：匹配字符串的结束位置
量词
- *：重复任意次，相当于{0,}
- ?：重复0次或1次，相当于{0,1}
- +：重复1次或更多次，相当于{1,}
- {n}：重复n次
- {n,}：重复n次或者大于n次
- {n,m}：重复n到m次
分支&字符集
- 在字符集中（特定情况下）有特殊语义的字符需要进行转义
- 分支：(a|b|c) == [abc] == [a-c]
- 字符集（仅表示一个字符）：
  - [abc] == [a-c]
  - [^abc] == [^a-c]
分组&引用
- () => 子表达式
- /(\d{4})-(\d{2})-(\d{2})/
- /(\d{4})-(\d{2})-\2/
- /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/（可读性不好，且只有9个 => 别名）
- /(?<year>\d{4})-(?<month>\d{2})-\k<month>/（使用别名）
- replace
- RegExp.$[1-9_]
转义
- 使用\转义
- 需要转义的字符？
零宽断言（lookaround assertions）
- 也翻译成环视，零宽=>只是代表一个**“位置”**，不占用任何字符
- 根据方向的不同，分为lookahead和lookbehind（正向/预测先行/顺序/从左到右/pattern的前面位置 vs 负向/回顾后发/逆序/从右到左/pattern的后面位置）
- 根据判定原则，分为肯定和否定（肯定/正 vs 否定/负）
- (?=pattern)、(?<=pattern)、(?!pattern)、(?<!pattern)
- Q：如何匹配igm三个字符的随机组合，但是不能重复
- A：/^(?!([img])(?=.*\1))[img]+$/
- $/^(?!([img])(?=.*\1))[img]+$/$
惰性&贪婪（影响性能和匹配的结果）
- 贪婪模式——在匹配成功的前提下，尽可能多的去匹配。贪婪模式用于匹配优先量词修饰的子表达式（贪婪量词：*、+、{n,}）
- 惰性模式——在匹配成功的前提下，尽可能少的去匹配。惰性模式用于匹配忽略优先量词修饰的子表达式（惰性量词：?修饰贪婪量词尽可能少的去匹配）
- /.*bbb/g.test('abbbaabbbaaabbb1234')
- /.*?bbb/.test('abbbaabbbaaabbb1234')
- 如何写出高性能的正则——需要了解你要匹配的样本
修饰符&标志
- i：ignoreCase
- g：global
- m：multiline
- y：sticky
- u：unicode
- s：dotAll，/./s == /[\w\W]/ == /[\s\S]/ == /[\b\B]/ == /[\d\D]/
使用方法
- exec
- test
- match
- search
- replace
- split

参考资料

（本篇完）

前端晚自修

历史

几个重要概念

参考资料

移动前端开发收藏夹

Pixi教程

微前端的那些事儿

大数据入门指南

安卓应用安全指南

各种程序开发相关的Awesome开源项目清单