简单介绍正则表达式拆分url实例代码

admin10个月前笔记88

背景

做web开发的同学,经常会有从url中获取二级域名或者主域名或者参数等等需求,需要扎实的正则功底。本文提供一个全面的url拆分案例,需要哪个部分用哪个部分。

案例

将url的各个部分拆开,让我想取哪部分就取哪部分?

url: http://www.baidu.com/love/java?lang=java regex: (\w+):\/\/([^/:]+)(:\d*)?([^# ]*)

使用js举例

var url = "http://www.baidu.com:80/love/java?lang=java"; var patt1 = /(\w+):\/\/([^/:]+)(:\d*)?([^# ]*)/; arr = url.match(patt1); for (var i = 0; i < arr.length ; i++) {     document.write(arr[i]);     document.write("
"); }

输出结果如下:

http://www.baidu.com:80/love/java?lang=java http www.baidu.com :80 /love/java?lang=java

使用java举例

String url = "http://www.baidu.com:80/love/java?lang=java"; Pattern pattern = Pattern.compile("(\\w+):\\/\\/([^/:]+)(:\\d*)?([^# ]*)"); Matcher matcher = pattern.matcher(url); matcher.find(); for (int i = 1; i <= matcher.groupCount(); i++){     System.out.println(matcher.group(i)); }

输出结果:

http www.baidu.com :80 /love/java?lang=java

正则说明

实例中的数组包含 5 个元素,索引 0 对应的是整个字符串,索引 1 对应第一个匹配符(括号内),以此类推。

第一个括号子表达式捕获 Web 地址的协议部分。该子表达式匹配在冒号和两个正斜杠前面的任何单词。

第二个括号子表达式捕获地址的域地址部分。子表达式匹配非 : 和 / 之后的一个或多个字符。

第三个括号子表达式捕获端口号(如果指定了的话)。该子表达式匹配冒号后面的零个或多个数字。只能重复一次该子表达式。

第四个括号子表达式捕获 Web 地址指定的路径和 / 或页信息。该子表达式能匹配不包括 # 或空格字符的任何字符序列。

到此这篇关于正则表达式拆分url的文章就介绍到这了。


相关文章

如何解决Oracle临时表空间过大

方案一:增加临时表空间的大小--1.临时表空间的使用情况题SELECT D.tablespace_name, SPACE "SUM_SPACE(M)", b...

虚拟主机解决电信网通间互联互通

电信和网通两大基础网络,人为地割裂了整个中国的网络。无论是选择把网站托管在电信、还是网通,都等于是在拒绝处于另外一个网络中的客户,因为实在太慢了。  那么有什么办法可以解决这个问题呢?目前主流的解决方...

linux系统指令概要

常用命令:clear 清屏 pwd Print Working Directory的缩写,可显示当前所在工作目录的全路径 whoami 当前用户的...

Linux下的文件I/O编程

Linux下的文件I/O编程

(一).open()打开文件#include <sys/types.h> #include <sys/stat.h> #include int&nbs...

Linux下su与su -命令的本质区别

Linux下su与su -命令的本质区别

su与su -命令的本质区别我首先是用su命令切换到root身份的,但是运行useradd时,出现错误:bash: useradd: command not found。google了一下,原因是在这...

haproxy详解

1.安装haproxyCentOS自带了haproxy,但可能版本比较老。可以在IUS源上找到最新稳定版的haproxy。cat </etc/yum.repos.d/ius.repo...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。