正则表达式
Go 提供了内建的正则表达式支持。 这儿有一些在 Go 中与 regexp 相关的常见用法示例。
代码示例
package main
import (
"bytes"
"fmt"
"regexp"
)
func main() {
// 测试一个字符串是否符合一个表达式。
match, _ := regexp.MatchString("p([a-z]+)ch", "peach")
fmt.Println(match)
// 上面我们是直接使用字符串,但是对于一些其他的正则任务, 你需要通过 Compile 得到一个优化过的 Regexp 结构体。
r, _ := regexp.Compile("p([a-z]+)ch")
// 该结构体有很多方法。这是一个类似于我们前面看到的匹配测试。
fmt.Println(r.MatchString("peach"))
// 查找匹配的字符串。
fmt.Println(r.FindString("peach punch"))
// 这个也是查找首次匹配的字符串, 但是它的返回值是,匹配开始和结束位置的索引,而不是匹配的内容。
fmt.Println("idx:", r.FindStringIndex("peach punch"))
// Submatch 返回完全匹配和局部匹配的字符串。 例如,这里会返回匹配 p([a-z]+)ch 和 ([a-z]+) 的信息。
fmt.Println(r.FindStringSubmatch("peach punch"))
// 类似的,这个会返回完全匹配和局部匹配位置的索引。
fmt.Println(r.FindStringSubmatchIndex("peach punch"))
// 带 All 的这些函数返回全部的匹配项, 而不仅仅是首次匹配项。例如查找匹配表达式全部的项。
fmt.Println(r.FindAllString("peach punch pinch", -1))
// All 同样可以对应到上面的所有函数。
fmt.Println("all:", r.FindAllStringSubmatchIndex(
"peach punch pinch", -1))
// 这些函数接收一个非负整数作为第二个参数,来限制匹配次数。
fmt.Println(r.FindAllString("peach punch pinch", 2))
// 上面的例子中,我们使用了字符串作为参数, 并使用了 MatchString 之类的方法。 我们也可以将 String 从函数名中去掉,并提供 []byte 的参数。
fmt.Println(r.Match([]byte("peach")))
// 创建正则表达式的全局变量时,可以使用 Compile 的变体 MustCompile 。 MustCompile 用 panic 代替返回一个错误 ,这样使用全局变量更加安全。
r = regexp.MustCompile("p([a-z]+)ch")
fmt.Println("regexp:", r)
// regexp 包也可以用来将子字符串替换为为其它值。
fmt.Println(r.ReplaceAllString("a peach", "<fruit>"))
// Func 变体允许您使用给定的函数来转换匹配的文本。
in := []byte("a peach")
out := r.ReplaceAllFunc(in, bytes.ToUpper)
fmt.Println(string(out))
}
执行结果
$ go run regular-expressions.go
true
true
peach
idx: [0 5]
[peach ea]
[0 5 1 3]
[peach punch pinch]
all: [[0 5 1 3] [6 11 7 9] [12 17 13 15]]
[peach punch]
true
regexp: p([a-z]+)ch
a <fruit>
a PEACH
有关 Go 正则表达式的说明,请参考 regexp 包文档。