当前位置:首页 >> 网络编程

PHP正则表达式基本函数 修饰符 元字符和需转义字符说明

我在写小偷中用了大量的正则,所以在接下来的版本中要逐步减少正则的应用


在PHP正则表达式中需要转义的字符如下:

$^*()+={}[]|/:<>.?'"

注意:perl风格中表达式要求以/开始和结尾,如:/food/ 表匹配字符 food

perl修饰符如下:

i 完成不区分大小写的搜索
g 查找所有出现(all occurrences,完成全局搜索)
m 将一个字符串视为多行(m就表示多(multiple))。默认情况下,^和$字符匹配字符串中的最开始和最末尾。使用m修饰符将使^和$匹配字符串中每行的开始
s 将一个字符串视为一行,忽略其中的所有换行符;它与m修饰符正好相反
x 忽略正则表达式中的空白和注释
U 第一次匹配后停止。默认情况下,将找到最后一个匹配字符结果。利用这个修饰符可以在第一次匹配后停止。进而形式循环匹配。

元字符说明:

利用Perl正则表达式还可以做另一件有用的事情,这就是使用各种元字符来搜索匹配。元字符(metacharacter)就是一个前面有反斜线的字母字符,表示某种特殊含义。以下是一些有用的元字符。

A 只匹配字符串开头
b 匹配单词边界
B 匹配单词边界之外的任意字符
d 匹配数字字符,它与[0-9]相同
D 匹配非数字字符
s 匹配空白字符
S 匹配非空白字符
[] 包围一个字符类,字符类包括:[0-9] [a-z] [a-zA-Z] 等类似。
() 包围一个字符分组或定义一个反引用
$ 匹配行尾
^ 匹配行首
* 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 *
+ 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 +
? 匹配前面的子表达式零次或一次,或指明一个非贪婪限定符 ?
. 匹配除换行之外的任何字符
引出下一个元字符
w 匹配任何只包含下划线和字母数字字符的字符串,它与 [a-zA-Z0-9_]相同
W 匹配没有下划线和字母数字字符的字符串

Perl风格函数有:

array preg_grep(string pattern, array input [, flags])
搜索数组中所有元素,返回由与某个模式匹配的所有元素组成的数组
PHP 4.3增加了一个可选参数 flag,它接受一个值 PREG_GREP_INVERT 传递此标志将得到与该模式不匹配的数据元素。

int preg_match(string pattern, string string [, array matches [, int flags [, int offset]]])
在字符串中搜索模式,如果存在返回TRUE,否则返回FALSE。
可选输入参数matches可以包含搜索模式中包含的子模式的各个部分。默认返回 匹配的字符串,当有()子包围时,会在数组后面输出。

int preg_match_all(string pattern, string string, array pattern_array [, int order])
和函数 preg_match一样,不过 preg_match 只搜索一次,而 preg_match_all 会执行循环搜索,返回所有匹配的结果。

mixed preg_replace(mixed pattern, mixed replacement, mixed str [, int limit])
用replacement替换pattern的所有出现,并返回修改后的结果。
可选 limit 指定应当发生多少次匹配。不设置limit或设置为-1将替换所有出现的情况。


以上为常用函数,还有 preg_quote, preg_replace_callbak, preg_split等详细解释略。。。