### JavaScript 正则表达式中分组详解
#### 捕获性分组与非捕获性分组
在JavaScript的正则表达式中,**分组**是一种非常重要的概念,它通过使用圆括号 `()` 来创建一组匹配模式。分组的主要作用在于将多个字符或表达式组合起来作为一个整体进行匹配,并且可以用来提取特定部分的匹配结果。本文将详细介绍两种类型的分组——捕获性分组和非捕获性分组。
##### 捕获性分组
捕获性分组是通过圆括号 `()` 创建的基本分组类型。当正则表达式成功匹配时,这些分组内的文本会被捕获并存储在一个临时的结果列表中,可以通过匹配结果的数组索引访问。例如,在使用 `match` 或 `exec` 方法时,除了整个匹配结果外,还可以获取到每个捕获性分组的匹配结果。
**示例1**:
```javascript
var reg = /test(\d+)/;
var str = 'newtest001test002';
console.log(str.match(reg)); // ["test001","001",index:4,input:"newtest001test002"]
```
在这个例子中,`(\d+)` 是一个捕获性分组,它会匹配一个或多个数字。当字符串 "test001" 被匹配时,整个匹配结果是 "test001",而捕获性分组 "(\d+)" 匹配到了 "001"。因此,`match` 方法返回的结果数组中不仅包含了整个匹配结果 "test001",还包含了捕获性分组的结果 "001"。
**示例2**:
```javascript
var reg = /test(\d)+/;
var str = 'newtest001test002';
console.log(str.match(reg)); // ["test001","1",index:4,input:"newtest001test002"]
```
在这个例子中,`(\d)+` 表示至少匹配一个数字。与示例1的不同之处在于,虽然整体匹配结果仍然是 "test001",但是捕获性分组的结果是 "1"。这是因为在贪心模式下(默认模式),`(\d)+` 试图匹配尽可能多的数字,但在 "001" 中,"1" 是最后被匹配到的数字,因此 "1" 成为了捕获性分组的结果。
如果希望非贪心地匹配最少数量的数字,可以在正则表达式末尾加上问号 `?`:
**示例3**:
```javascript
var reg = /test(\d)+?/;
var str = 'newtest001test002';
console.log(str.match(reg)); // ["test001","0",index:4,input:"newtest001test002"]
```
这里,`(\d)+?` 表示尽可能少地匹配数字,所以捕获性分组的结果为 "0"。
##### 非捕获性分组
非捕获性分组允许我们创建一个不被捕获的分组,即不会将分组内的匹配结果保存到结果列表中。这对于那些只需要作为整体匹配的一部分,而不关心其具体值的情况非常有用。创建非捕获性分组的方法是在圆括号前加上 `?:`。
**示例4**:
```javascript
var reg = /test(?:\d)+/;
var str = 'newtest001test002';
console.log(str.match(reg)); // ["test001",index:4,input:"newtest001test002"]
```
在这个例子中,`(?:\d)+` 是一个非捕获性分组,它同样匹配至少一个数字,但由于是非捕获性的,因此 `match` 方法的返回结果中不会包含分组内的匹配结果 "001"。
**总结**:
- **捕获性分组**:通过圆括号 `()` 创建,可以捕获分组内的匹配结果,便于后续处理。
- **非捕获性分组**:通过 `(?:)` 创建,主要用于整体匹配,不保留分组内的匹配结果。
这两种分组方式在实际开发中都非常有用,根据需求选择合适的分组类型可以更好地满足不同的匹配需求。