首页 > 代码库 > 正则表达式简单入门

正则表达式简单入门



正则表达式简单入门

   正则表达式在平常编程中有着大量的应用,对于任何一个想学习编程的人来说,正则表达式是一个必须掌握的知识。

   废话不多说,下面先对正则表达式做一个简单的入门介绍,在后续的文章中,将会进行详细的介绍。


   一、元字符

   元字符一共有12个:$ ( ) [ { ? + * . ^ \ |

   元字符有特殊的含义,如果要使用其字面值,则必须对其进行转义。

       如: \$  \*  \( 等等


   二、控制字符或不可打印字符

       \a  警报

       \e  退出

       \f  换页

       \n  换行

       \r  回车

       \t  水平制表

       \v  垂直制表


   三、简写

      \d  单个数字  [0-9]  (注意:[]表示取中括号里面所有字符的其中之一; -是连接字符,表示大于等于0小于等于9的所有字符

      \w  字母、数字、下划线

      \s  空白字符,包括空格、换行符、制表符

          注意:\D  \W  \S匹配的是\d  \w  \s不能匹配的字符


   四、重复

      固定次数:{8} ---重复8次

      无限次:{n}

      零次或多次:{0,}   等价于   *

      一次或多次:{1,}   等价于   +

      零次或一次:{0,1}  等价于   ?


   下面我们来看一个例子:

    匹配时间格式,要求如下:

    1.时分秒分别用两个数字表示,毫秒用三个数字表示

    2.时对应的范围:00--99

    3.分和秒对应的范围:00--59

    4.毫秒对应的范围:000--999

    5.按如下格式:12:34:56.789


       解答:

          1、时的两位数字均为0到9其中之一,我们可以表示成[0-9][0-9]或[0-9]{2}或\d\d或\d{2}

          2、分和秒的格式是一样的,并且其前面均有:,所以我们表示成(:[0-5]\d){2}

          3、毫秒可以表示成\d\d\d或\d{3}

       综上:\d\d(:[0-5]\d){2}\.\d{3}  注意此处有一个元字符".",我们取其字面值,需要转义。

                      用RegexBuddy验证:




正则表达式简单入门