手机版
你好,游客 登录 注册 搜索
背景:
阅读新闻

Linux正则表达式特性及BRE与ERE的区别

[日期:2014-03-30] 来源:Linux社区  作者:wz102 [字体: ]

Linux正则表达式(Regular Expression)主要遵从POSIX BRE或者POSIX ERE标准。什么是POSIX呢,POSIX Portable Operating System Interface 可移植操作系统接口ERE是BRE的扩展版本,具体更强的处理能力,并增加了一些元字符(metacharactor)。

BRE主要的能力集有:

1) 普通字符(Literal text),如a,b,c等

2)非打印字符,包括TAB,回车,换行,回车换行(WINDOWS)

3)任意字符.

4)字符集,包括单词型字符([[:alnum:]]),非单词型字符([^[:alnum:]]),数字([[:digit:]]),非数字([^[:alnum:]]),空格、TAB、换行等空白字符([[:space:]])以及非空白字符([^[:space:]])

5)边缘匹配符,不管是BRE还是ERE,都只支持匹配行首或行尾,不像perl,还可以匹配单词首和单词尾

6)匹配重复次数(Quantifier/Repetition)

7)分组及后向引用

8)多项匹配(Alteration),使用元字符|,该特性只ERE支持,BRE没有此功能

BRE与ERE似乎对ASCII和UNICODE是否都支持尚待确认;

正前向查找和负前向查找不支持;

正后向查找和负后向查找不支持;

BRE与ERE在能力上区别仅在多项匹配的能力上,其他方面没有大的差别,主要的区别体现在元字符上。

BRE只定义了4组元字符:

[]      用于在多个字符中选定一个字符进行匹配,[]内可以有-以示范围,但-本身不是元字符

.        用于匹配任意字符

^      用于匹配时表示“非”的含义,还有一个用法是匹配行首

$      用于匹配行尾

ERE在此基础上增加了3组元字符的定义:

{}      用于表示重复匹配的次数。BRE中只将{}当作普通字符对待,要使用此功能必须加\进行转义,即“\{\}”

()      用于分组。BRE中只将()当作普通字符对待,要使用此功能必须加\进行转义,即“\(\)”

|      完全为ERE新增的多项匹配能力定义的,BRE无多项匹配能力,只将|作普通字符对待

linux
相关资讯       正则表达式  Linux正则表达式 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款