常用正则表达式——校验数字、字符、一些特殊的需求等

在我们编写程序的时候,经常会一些一些验证;
在我们使用的验证中,无疑正则是最号用的。
但对不太懂正则的朋友,在遇到需要用正则校验数据时,
往往是在网上去找很久,结果找来的还是不很符合要求。
所以我最近把开发中常用的一些正则表达式整理了一下,
在这里分享一下。给自己留个底,也给朋友们做个参考。
一、校验数字的表达式

    1 数字:^\[0-9\]*$ 
    2 n位的数字:^\\d{n}$
    3 至少n位的数字:^\\d{n,}$ 
    4 m-n位的数字:^\\d{m,n}$ 
    5 零和非零开头的数字:^(0|\[1-9\]\[0-9\]*)$ 
    6 非零开头的最多带两位小数的数字:^(\[1-9\]\[0-9\]*)+(.\[0-9\]{1,2})?$ 
    7 带1-2位小数的正数或负数:^(\\-)?\\d+(\\.\\d{1,2})?$ 
    8 正数、负数、和小数:^(\\-|\\+)?\\d+(\\.\\d+)?$ 
    9 有两位小数的正实数:^\[0-9\]+(.\[0-9\]{2})?$
    10 有1~3位小数的正实数:^\[0-9\]+(.\[0-9\]{1,3})?$
    11 非零的正整数:^\[1-9\]\\d*$ 或 ^(\[1-9\]\[0-9\]*){1,3}$ 或 ^\\+?\[1-9\]\[0-9\]*$
    12 非零的负整数:^\\-\[1-9\]\[\]0-9"*$ 或 ^-\[1-9\]\\d*$
    13 非负整数:^\\d+$ 或 ^\[1-9\]\\d*|0$
    14 非正整数:^-\[1-9\]\\d*|0$ 或 ^((-\\d+)|(0+))$
    15 非负浮点数:^\\d+(\\.\\d+)?$ 或 ^\[1-9\]\\d*\\.\\d*|0\\.\\d*\[1-9\]\\d*|0?\\.0+|0$
    16 非正浮点数:^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$ 或 ^(-(\[1-9\]\\d*\\.\\d*|0\\.\\d*\[1-9\]\\d*))|0?\\.0+|0$
    17 正浮点数:^\[1-9\]\\d*\\.\\d*|0\\.\\d*\[1-9\]\\d*$ 或 ^((\[0-9\]+\\.\[0-9\]*\[1-9\]\[0-9\]*)|(\[0-9\]*\[1-9\]\[0-9\]*\\.\[0-9\]+)|(\[0-9\]*\[1-9\]\[0-9\]*))$
    18 负浮点数:^-(\[1-9\]\\d*\\.\\d*|0\\.\\d*\[1-9\]\\d*)$ 或 ^(-((\[0-9\]+\\.\[0-9\]*\[1-9\]\[0-9\]*)|(\[0-9\]*\[1-9\]\[0-9\]*\\.\[0-9\]+)|(\[0-9\]*\[1-9\]\[0-9\]*)))$
    19 浮点数:^(-?\\d+)(\\.\\d+)?$ 或 ^-?(\[1-9\]\\d*\\.\\d*|0\\.\\d*\[1-9\]\\d*|0?\\.0+|0)$

二、校验字符的表达式

    1 汉字:^\[\\u4e00-\\u9fa5\]{0,}$ 
    2 英文和数字:^\[A-Za-z0-9\]+$ 或 ^\[A-Za-z0-9\]{4,40}$ 
    3 长度为3-20的所有字符:^.{3,20}$ 
    4 由26个英文字母组成的字符串:^\[A-Za-z\]+$ 
    5 由26个大写英文字母组成的字符串:^\[A-Z\]+$ 
    6 由26个小写英文字母组成的字符串:^\[a-z\]+$ 
    7 由数字和26个英文字母组成的字符串:^\[A-Za-z0-9\]+$ 
    8 由数字、26个英文字母或者下划线组成的字符串:^\\w+$ 或 ^\\w{3,20}$ 
    9 中文、英文、数字包括下划线:^\[\\u4E00-\\u9FA5A-Za-z0-9_\]+$
    10 中文、英文、数字但不包括下划线等符号:^\[\\u4E00-\\u9FA5A-Za-z0-9\]+$ 或 ^\[\\u4E00-\\u9FA5A-Za-z0-9\]{2,20}$
    11 可以输入含有^%&',;=?$\\"等字符:\[^%&',;=?$\\x22\]+
    12 禁止输入含有~的字符:\[^~\\x22\]+

三、特殊需求表达式

    1 Email地址:^\\w+(\[-+.\]\\w+)*@\\w+(\[-.\]\\w+)*\\.\\w+(\[-.\]\\w+)*$ 
    2 域名:\[a-zA-Z0-9\]\[-a-zA-Z0-9\]{0,62}(/.\[a-zA-Z0-9\]\[-a-zA-Z0-9\]{0,62})+/.? 
    3 InternetURL:\[a-zA-z\]+://\[^\\s\]* 或 ^http://(\[\\w-\]+\\.)+\[\\w-\]+(/\[\\w-./?%&=\]*)?$ 
    4 手机号码:^(13\[0-9\]|14\[5|7\]|15\[0|1|2|3|5|6|7|8|9\]|18\[0|1|2|3|5|6|7|8|9\])\\d{8}$ 
    5 电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\\(\\d{3,4}-)|\\d{3.4}-)?\\d{7,8}$  
    6 国内电话号码(0511-4405222、021-87888822):\\d{3}-\\d{8}|\\d{4}-\\d{7} 
    7 身份证号(15位、18位数字):^\\d{15}|\\d{18}$ 
    8 短身份证号码(数字、字母x结尾):^(\[0-9\]){7,18}(x|X)?$ 或 ^\\d{8,18}|\[0-9x\]{8,18}|\[0-9X\]{8,18}?$ 
    9 帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^\[a-zA-Z\]\[a-zA-Z0-9_\]{4,15}$
    10 密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^\[a-zA-Z\]\\w{5,17}$
    11 强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.*\\d)(?=.*\[a-z\])(?=.*\[A-Z\]).{8,10}$
    12 日期格式:^\\d{4}-\\d{1,2}-\\d{1,2}
    13 一年的12个月(01~09和1~12):^(0?\[1-9\]|1\[0-2\])$
    14 一个月的31天(01~09和1~31):^((0?\[1-9\])|((1|2)\[0-9\])|30|31)$
    15 钱的输入格式:
    16 1.有四种钱的表示形式我们可以接受:"10000.00" 和 "10,000.00", 和没有 "分" 的 "10000" 和 "10,000":^\[1-9\]\[0-9\]*$
    17 2.这表示任意一个不以0开头的数字,但是,这也意味着一个字符"0"不通过,所以我们采用下面的形式:^(0|\[1-9\]\[0-9\]*)$
    18 3.一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号:^(0|-?\[1-9\]\[0-9\]*)$
    19 4.这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧.下面我们要加的是说明可能的小数部分:^\[0-9\]+(.\[0-9\]+)?$
    20 5.必须说明的是,小数点后面至少应该有1位数,所以"10."是不通过的,但是 "10" 和 "10.2" 是通过的:^\[0-9\]+(.\[0-9\]{2})?$
    21 6.这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样:^\[0-9\]+(.\[0-9\]{1,2})?$
    22 7.这样就允许用户只写一位小数.下面我们该考虑数字中的逗号了,我们可以这样:^\[0-9\]{1,3}(,\[0-9\]{3})*(.\[0-9\]{1,2})?$
    23 8.1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须:^(\[0-9\]+|\[0-9\]{1,3}(,\[0-9\]{3})*)(.\[0-9\]{1,2})?$
    24 备注:这就是最终结果了,别忘了"+"可以用"*"替代如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里
    25 xml文件:^(\[a-zA-Z\]+-?)+\[a-zA-Z0-9\]+\\\\.\[x|X\]\[m|M\]\[l|L\]$
    26 中文字符的正则表达式:\[\\u4e00-\\u9fa5\]
    27 双字节字符:\[^\\x00-\\xff\] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))
    28 空白行的正则表达式:\\n\\s*\\r (可以用来删除空白行)
    29 HTML标记的正则表达式:<(\\S*?)\[^>\]*>.*?</\\1>|<.*? /> (网上流传的版本太糟糕,上面这个也仅仅能部分,对于复杂的嵌套标记依旧无能为力)
    30 首尾空白字符的正则表达式:^\\s*|\\s*$或(^\\s*)|(\\s*$) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)
    31 腾讯QQ号:\[1-9\]\[0-9\]{4,} (腾讯QQ号从10000开始)
    32 中国邮政编码:\[1-9\]\\d{5}(?!\\d) (中国邮政编码为6位数字) 33 IP地址:\\d+\\.\\d+\\.\\d+\\.\\d+ (提取IP地址时有用) 34 IP地址:((?:(?:25\[0-5\]|2\[0-4\]\\\\d|\[01\]?\\\\d?\\\\d)\\\\.){3}(?:25\[0-5\]|2\[0-4\]\\\\d|\[01\]?\\\\d?\\\\d)) 

四、其他应用
(1)应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 
String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;} 
(2)应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现 
String.prototype.trim = function() 
{
return this.replace(/(^s)|(s$)/g, ""); 

(3)应用:利用正则表达式分解和转换IP地址 
function IP2V(ip) //IP地址转换成对应数值 

re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正则表达式 
if(re.test(ip)){
return RegExp.$1*Math.pow(255,3))+RegExp.$2Math.pow(255,2))+RegExp.$3*255+RegExp.$4
}else{
throw new Error("Not a valid IP address!") 
}
}
(4)应用:从URL地址中提取文件名的javascript程序 
s="http://www.9499.net/page1.htm"; 
s=s.replace(/(./){0,}([^.]+)./ig,"$2") ;//Page1.htm 
(5)应用:利用正则表达式限制网页表单里的文本框输入内容  ^[\u4e00-\u9fa5]{0,}$
用正则表达式限制只能输入中文:onkeyup="value=value.replace(/[^u4E00-u9FA5]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^u4E00-u9FA5]/g,''))" 
用正则表达式限制只能输入全角字符: onkeyup="value=value.replace(/[^uFF00-uFFFF]/g,'') "onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^uFF00-uFFFF]/g,''))" 
用正则表达式限制只能输入数字:onkeyup="if(event.keyCode !=37 && event.keyCode != 39)value=value.replace(/\D/g,'')"
用正则表达式限制只能输入数字和英文:onkeyup="if(event.keyCode !=37 && event.keyCode != 39)value=value.replace(/\W/g,'')"
首先在正则表达式中使用 Unicode,必须使用\u开头,接着是字符编码的四位16进制表现形式
简单匹配中文方法: /[^\u0000-\u00FF]/ (匹配非单字节字符 )
另错误方法:/[^\u00-\uFF]/ (匹配 非单字节字符、还包括一些全半角符号如,.(){}'"!等、还有vwxyz字符)
说明: //u0000-u00ff.包含unicode单字节编码( 0-255编码)包含基本控制字符和拉丁文字母。 采用该否定表达式,粗略判断是否含有中文。
 
具体的匹配中文及字符方法:/[\u4E00-\u9FA5\uF900-\uFA2D]/
说明: u4e00-u9fbf :  unicode CJK(中日韩)统一表意字符。u9fa5后至u9fbf为空 
uF900-uFAFF :  为unicode  CJK 兼容象形文字  。uFA2D后至uFAFF为空
冯奎博客
<span style="color: rgb(0, 0, 255); font-family: tahoma, arial, "Microsoft YaHei"; background-color: rgb(255, 255, 255); font-size: 18px;"></span>

冯奎博客
请先登录后发表评论
  • latest comments
  • 总共0条评论