正则表达式速查手册:从入门到精通

AuthorMarch 1, 20241 min read

什么是正则表达式?

正则表达式(Regular Expression)是一种用于匹配字符串中字符组合的模式。它就像一种"通配符"语言,可以用来搜索、替换、验证文本。正则表达式广泛应用于表单验证、日志分析、数据提取、文本替换等场景。

基础元字符

  • . — 匹配任意单个字符(除换行符外)
  • \d — 匹配任意数字,等价于 [0-9]
  • \w — 匹配字母、数字、下划线,等价于 [a-zA-Z0-9_]
  • \s — 匹配任意空白字符(空格、制表符、换行)
  • \b — 匹配单词边界

量词

  • * — 匹配0次或多次(贪婪)
  • + — 匹配1次或多次(贪婪)
  • ? — 匹配0次或1次
  • {n} — 精确匹配n次
  • {n,} — 至少匹配n次
  • {n,m} — 匹配n到m次

字符类

  • [abc] — 匹配a、b或c中的任意一个
  • [^abc] — 匹配除a、b、c之外的任意字符
  • [a-z] — 匹配小写字母a到z
  • [A-Z] — 匹配大写字母A到Z
  • [0-9] — 匹配数字0到9

锚点

  • ^ — 匹配字符串开头
  • $ — 匹配字符串结尾

分组与引用

  • (abc) — 捕获分组,匹配并记住"abc"
  • (?:abc) — 非捕获分组,匹配但不记住
  • \1 — 反向引用第一个捕获组
  • (?=abc) — 正向先行断言
  • (?!abc) — 负向先行断言

常用正则模式

  • 邮箱:^[\w.-]+@[\w.-]+\.[a-zA-Z]{2,}$
  • 手机号(中国):^1[3-9]\d{9}$
  • URL:^https?://[\w.-]+(:\d+)?(/.*)?$
  • IP地址:^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$

修饰符

  • g — 全局匹配(找到所有匹配项)
  • i — 不区分大小写
  • m — 多行模式(^和$匹配每行开头/结尾)
  • s — 点号匹配包括换行符

总结

正则表达式是一门"一次学习,终身受益"的技能。虽然语法看起来晦涩,但只要掌握了基础规则,就能通过组合创造出强大的匹配模式。建议配合在线正则测试工具多加练习。

Recommended

Try our Word Counter

Try our professional online tool now. Completely free, no registration required.

Try it now
Share this article

Author

Experienced content creator, dedicated to sharing practical online tools and tutorials.

View all articles

Comments coming soon

Stay tuned