Java魔法堂:URI、URL(含URL Protocol Handler)和URN

转载自   Java魔法堂:URI、URL(含URL Protocol Handler)和URN

一、前言                              

  过去一直搞不清什么是URI什么是URL,现在是时候好好弄清楚它们了!本文作为学习笔记,以便日后查询,若有纰漏请大家指正!

 

二、从URI说起                            

 1. 概念

  URI(Uniform Resource Identifier,统一资源标识符)以字符串来表示某种资源的统一资源标识。

  格式为: [scheme:]scheme-specific-part[#fragment] 

  [scheme:]组件 ,URI的名称空间标识。

  scheme-specific-part组件 ,用于标识资源,内部格式由具体的 scheme 来决定。

  [#fragment]组件 ,井号(#)作为fragment组件的起始字符,而fragment组件则用于聚焦到资源的某个部分。

 2. 绝对URI和相对URI

  绝对URI:以scheme组件起始的完整格式,如http://fsjohnhuang.cnblogs.com。表示以对标识出现的环境无依赖的方式引用资源。

  相对URI:不以scheme组件起始的非完整格式,如fsjohnhuang.cnblogs.com。表示以对依赖标识出现的环境有依赖的方式引用资源。

  实例:当前页面地址为http://fsjohnuang.cnblogs.com

// html snippet
<a id="test" href="test.com">test.com</a>// js snippet
<script>var href = document.getElementById('test').hrefconsole.log(href) // 显示 http://test.com
</script>

 3. 不透明URI和分层URI

   不透明URI:scheme-specific-part组件不是以正斜杠(/)起始的,如mailto:fsjohnhuang@xxx.com。由于不透明URI无需进行分解操作,因此不会对scheme-specific-part组件进行有效性验证。

   分层URI:scheme-specific-part组件是以正斜杠(/)起始的,如http://fsjohnhuang.com。

      scheme-specific-part组件格式为: [//authority][path][?query] 

      [//authority] ,表示授权机构组件,以一对正斜杠(//)起始,可以基于主机(server-based)或注册(registry-based)(而基于注册相对基于主机的数目较少),并以正斜杠、问号或无后续字符作为authority组件的结束。而authority组件的具体格式为 [userinfo@]host[:port] 。

         [userinfo@] ,用户账号。

     host ,主机IP或域名。

     [:port] ,通信端口号,若省略则使用相应的scheme组件的默认端口号。

            示例: http://fsjohnhuang@github.com:80/ 

      [path] ,path组件表示根据authority组件识别资源的位置。path组件有一系列的路径片段(path segment)构成,路径片段间以正斜杠(/)作为分隔符。若第一个路径片段以正斜杠(/)起始则为绝对路径,否则称为相对路径。

      [?query] ,query组件用于识别要传递给资源的数据,用于影响资源的响应的行为。

 4. 标准化(Normalization)、解析化(Resolution)和相对化(Relativization)

  标准化(Normalization):其实就是去除path组件中当前层(.)和上一层(..)这些冗余字符。如z/../y标准化为y。

  解析化(Resolution):以URI A作为基本URI来和另外一个URI一同解析为一个新的标准URI。如http://fsjohnhuang.com作为基本URI和z/../y一同解析成http://fsjohnhuang.com/y。

  相对化(Relativization):相对化其实就是解析化的相反操作。如http://fsjohnhuang.com作为基本URI和http://fsjohnhuang.com/z来作相对化操作得到/z。

 

  到这里我们可能会认为这不就跟平常的网站地址一样吗?为啥大家叫网站地址为URL,而不是URI呢?

  互联网之父Tim Berners-Lee引入用于识别、定位和命名互联网资源的途径——URI、URL和URN。三者彼此关联,URI的范畴位于体系的顶层,URL和URN的范畴位于体系的底层。

             

  • URI:Uniform Resource Identifier,统一资源标识符;
  • URL:Uniform Resource Locator,统一资源定位符;
  • URN:Uniform Resource Name,统一资源名称。

  上图可知URL和URN必须是URI,但URI却不一定是URL或URN。

  URI仅仅是资源名称而已,知道了URI最多就是知道有这么一个名称的资源罢了,至于如何获取(与资源作交互)则是毫无头绪(不能定位或读取/写入资源),而这个资源名称是永久持有还是暂时持有也没有相应的规定,于是就有了URL和URN两个子集。

  首先URL和URN均继承了URI格式中的各组件,然后在这基础上进行了各自的扩展?

  URL

   URL = URI(scheme组件为部分已知的网络协议的URI子集) + 与scheme组件标识的网络协议匹配的协议处理器(URL Protocol Handler)

     1. URI的scheme组件在URL中称为protocol组件,一般http、https、ftp、file、data、jar等。

     2. URL Protocol Handler则是一种资源定位器和根据协议建立的约束规则与资源通信的读写机制,用于定位、读写资源。

         如:安装迅雷后点击ed2k的迅雷种子时则会自动打开迅雷下载界面,这是为什么呢?

              迅雷种子就是资源,而ed2k就是资源URL的protocol组件,而迅雷就是URL Protocol Handler。而protocol组件与URL Protocol Handler间的映射关系在windows下则存放在注册表中,而Ubuntu中存放在/usr/share/applications/.desktop中。

              windows7下

                ①. 快捷键“开始”+r 弹出运行输入框,输入regedit进入注册表;

         ②. 进入HKEY_CURRENT_USER/Software/Classes目录下;

             ③. ed2k目录下包含shell/Open/command目录,右侧窗口有一个条名称为URL Protocol的REG_SZ记录,表示这是一个URL Protocol记录(没有这一条记录也不会有影响)

               

                 ④. 点击command目录后,右侧窗口有一条REG_SZ类型记录,数据列为"C:\Program Files (x86)\Thunder Network\Thunder\Program\ThunderNewTask.exe" "%1" 表示ThunderNewTask.exe作为URL Protocol Handler,而%1则是传递给Handler处理的URL。

         ⑤. 其实ed2k中还少了一个DefaultIcon目录,该目录下有一个REG_SZ类型的记录,用于指定该类型协议文件的图标。

 

              ubuntu下

      在/usr/share/applications/.desktop文件下添加如下内容

[Desktop Entry]
Encoding=UTF-8
Version=1.0
Type=Application
Terminal=false
Exec=/usr/bin/cloudjerun -c %u
Name=tunesview
Comment=Small, easy-to-use program to access iTunesU media
Icon=/usr/share/icons/hicolor/scalable/apps/tunesview.svg
Categories=Application;Network;
MimeType=x-scheme-handler/cloudje;

      Exec键值的占位符表:

Add...  Accepts...
%f      a single filename.
%F      multiple filenames.
%u      a single URL.
%U      multiple URLs.
%d      a single directory. Used in conjunction with %f to locate a file.
%D      multiple directories. Used in conjunction with %F to locate files.
%n      a single filename without a path.
%N      multiple filenames without paths.
%k      a URI or local filename of the location of the desktop file.
%v      the name of the Device entry.

     3. URL与资源地址关联,当资源位置变更后,URL也需要被修改。

  URN

   URN =  URI(scheme组件为部分已知的网络协议的URI子集) + 与scheme组件标识的网络协议匹配的协议处理器(URL Protocol Handler) + 持久性/地址无关性

   URN用于持久性地标识Internet资源,即使资源已经不存在或不可用时依然保持不变,通过实际的持久性策略实现资源位置发生变化也不用修改URI(地址无关性)。然而通过持久性策略还可以实现一条URN对应N条URI,如BT中的磁力链接(Magnet URI scheme)。

   如:magnet:?xt=urn:btih:4D9FA761D69964B00DF0B3B0C9C1F968EA6C47D0&xt=urn:ed2k:7655dbacff9395e579c4c9cb49cbec0e&dn=bbb_sunflower_2160p_30fps_stereo_abl.mp4

 

   说了这么多是时候总结一下URI、URL和URN的关联和区别了!

   1. 首先URI是基础,URL和URN均属于URI;

   2. URL = URI(scheme组件为部分已知的网络协议的URI子集) + 与scheme组件标识的网络协议匹配的协议处理器(URL Protocol Handler);

   3. URN突出的是持久化,通过具体的持久化策略实现地址无关性。 URN =  URI(scheme组件为部分已知的网络协议的URI子集) + 与scheme组件标识的网络协议匹配的协议处理器(URL Protocol Handler) + 持久性/地址无关性。

   

四、java.net.URI类和java.net.URL类             

   java当中对URI和URL单独提供java.net.URI和java.netURL两个操作类。

   java.net.URI中主要提供以下功能

      1. 验证URI格式

构造函数URI(String str),若格式不正确则抛出URISyntaxException
URI.create(String str),若格式不正确则抛出unchecked的IllegalArgumentException

      2. 提取URI各组件

getAuthority()
getFragment()
getHost()
getPath()
getPort()
getQuery()
getScheme()
getSchemeSpecificPart()
getUserInfo()

      3. 标准化、解析化和相对化

normalize(),,返回符合标准的URI新对象。如`x/y/../z/./q`->`x/z/q`
resolve(String/URI uri),进行反向解析,以入参作为相对URI,以resolve方法所属对象作为基本URI来得到一个新的标准的URI对象
relativize(URI uri),相对化操作,就是获取URI中的相对URI实例:
URI uriBase = new URI("http://www.somedomain.com");
URI uriRelative = new URI("x/../y");
URI uriResolve = uriBase.resolve(uriRelative); // http://www.somedomain.com/y
URI uriRelativized = uriBase.relativize(uriResolve); // y

      4. 将URI转成URL

URI#toURL(),将URI转换为URL。

      注意:不含任何搜索和读写资源的操作。

 java.net.URL中主要提供以下功能:

     URL类是依据URL Protocol Handler来处理URL字符串的,若没有相应的协议处理器则抛MalformedURLException。

     内置提供http、https、ftp、file和jar协议的URL Protocol Handler。而其他协议的处理器则需开发者自行继承URLStreamHandler来实现了。处理流程如下:

       1. 查看处理器缓存HashTable handlers,若存在缓存项则直接返回;

       2. 若缓存中没有则查看是否有URLStreamHandlerFactory实例,若存在则调用其createURLStreamHandler(String protocol)。默认情况下URLStreamHandlerFactory实例为null;

       3. 若2中返回null,则通过系统属性java.protocol.handler.pkgs获取以|分隔的包名列表,然后逐一检查是否存在继承了URLStreamHandler的<package>.<protocol>.Handler类,有则返回,无则继续遍历;

       4. 若3中遍历失败,则检查是否存在继承了URLStreamHandler的<system default package>.<protocol>.Handler的内置类。

       5. 上述均失败则抛出MalformedURLException。

    类URL中除了提供获取各组件的方法外,还提供了读写资源的方法如 InputStream openStream() 。下面我们通过URL类来读取t.txt文本文件的内容。

class Main{static void main(String[] args) throws IOException, MalformedURLException{String path1 = "d:\\t.txt", path2 = "file:/d:/t.txt";Main main = new Main();main.readByFr(path1);main.readByUrl(path2);}// 通过FileInputStream的写法void readByFr(String path) throws IOException{FileReader fr = new FileReader(path);try{int buf;while (-1 != buf){buf = fr.read();System.out.print((char)buf);}}finally{fr.close();}}// 通过URL的写法void readByURL(String path) throws MalformedURLException, IOException{URL url = new URL(path);InputStreamReader reader = new InputStreamReader(url.openStream());try{int buf;while (-1 != buf){buf = reader.read();System.out.print((char)buf);}}finally{reader.close();}}
}

     

五、总结                              

  上述内容若有纰漏请大家指正,谢谢!

 

六、参考                             

http://kb.cnblogs.com/page/90838/

https://msdn.microsoft.com/en-us/library/ms478653.aspx

http://www.cnblogs.com/wang726zq/archive/2012/12/11/UrlProtocol.html

http://stackoverflow.com/questions/16376429/ubuntu-custom-url-protocol-handler

http://www.ibm.com/developerworks/cn/xml/x-urlni.html

http://baike.baidu.com/link?url=agsiO-syltdQC_SlhSBThijAD3kSC4DVZcfnNPvO_KxGYOMCVqhiI58BDrn6tG06vohsH-evK1x7BqUj_wnR-a

JDK7 API


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/328657.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

升讯威微信营销系统开发教程:(1)订阅号和服务号深入分析

微信开发系列教程&#xff0c;将以一个实际的微信平台项目为案例&#xff0c;深入浅出的讲解微信开发、应用各环节的实现方案和技术细节。 原创内容&#xff0c;欢迎转载&#xff0c;转载请注明出处。 首先在第1章节中&#xff0c;我们先理清什么是订阅号&#xff0c;什么又是服…

不安装cudnn可不可以_Linux非root用户如何优雅的安装cuda和cudnn

Linux非root用户如何优雅的安装cuda和cudnn发布时间&#xff1a;2018-05-23 16:11,浏览次数&#xff1a;804, 标签&#xff1a;LinuxrootcudacudnnLinux非root用户如何优雅的安装cuda和cudnn跑深度学习模型时&#xff0c;总会遇到各种版本的问题。如深度学习框架与cuda的版本不…

如果你也会C#,那不妨了解下F#(4):了解函数及常用函数

函数式编程其实就是按照数学上的函数运算思想来实现计算机上的运算。虽然我们不需要深入了解数学函数的知识&#xff0c;但应该清楚函数式编程的基础是来自于数学。 例如数学函数f(x) x^2x&#xff0c;并没有指定返回值的类型&#xff0c;在数学函数中并不需要关心数值类型和返…

新闻发布项目——实体类(newsTb)

package bdqn.newsMange.entity;import java.util.Date;/*** 新闻的实体类* author Administrator**/ public class newsTb {private int newsID;// 编号private int categoryID;//类别编号(外键)private String summary;// 摘要private String title;//题目private String con…

Java URL协议扩展实现

转载自 Java URL协议扩展实现在信息交互系统设计中&#xff0c;不乏有自定义通讯协议设计。本章会介绍如何利用 java.net.URL 类来自定义协议。一般而言&#xff0c; URL 的格式是&#xff1a; protocol://[authority]hostname:port/resource?queryString 。 URL 类能够解析…

axure8 事件改变样式_AxureRP8实战手册-案例2(文本框:边框变色)

案例2. 文本框&#xff1a;边框变色案例来源:百度-登录界面案例效果&#xff1a;光标进入文本框时&#xff1a;(图1-6)案例描述&#xff1a;在登录界面中&#xff0c;包含用户名与密码的输入框。当焦点进入输入框时&#xff0c;输入框边框与内部图标变为蓝色&#xff1b;失去…

URL的getFile()和getPath()方法的区别

转载自 URL的getFile()和getPath()方法的区别 import java.net.MalformedURLException; import java.net.URL; public class dd { /** * param args */ public static void main(String[] args) { try { URL url new URL("file://ftp.yoyodyne.com/pub/files/fo…

webpack打包发布

npm run dev npm run dist --线上 git status git add . git commit -am "online adapter" git push git pull git branch --查看当前分支是在哪里master 还是 admin yarn install v1.3.2 yarn run dist -- 打包 fe-deply.sh --shell脚本 自动发布脚本 gi…

介绍开源的.net通信框架NetworkComms

Networkcomms 是一款C# 语言编写的TCP/UDP通信框架 作者是英国人 以前是收费的 目前作者已经开源 开源地址是:https://github.com/MarcFletcher/NetworkComms.Net networkcomms通讯框架使用简单方便,性能稳定. 从github上下载到源码后,需要Visual studio安装nuget 加载相关D…

dplayer js控制 自动全屏_vue-video-player 通过自定义按钮组件实现全屏切换效果【推荐】...

最近公司的产品上线&#xff0c;一些高级功能在基础版本中不对用户开发&#xff0c;通过视频的形式展示。产品开发用的是 vue, 经同事介绍使用了vue-video-player视频播放插件&#xff0c;通过 demo案例很快实现了视频播放效果class"vjs-custom-skin"ref"videoP…

新闻发布项目——实体类(comment)

package bdqn.newsMange.entity;import java.util.Date;/*** 新闻评论表*/ public class comment {private int commentID;//编号private String cmmUser;//用户名private String ip;//ipprivate String cmmContent;//内容private int newsID;//新闻IDprivate Date cmmDate;//…

java字符串格式化:String.format()方法的使用

转载自 java字符串格式化&#xff1a;String.format()方法的使用常规类型的格式化 String类的format()方法用于创建格式化的字符串以及连接多个字符串对象。熟悉C语言的读者应该记得C语言的sprintf()方法&#xff0c;两者有类似之处。format()方法有两种重载形式。 l for…

java web每天定时执行任务(四步轻松搞定)

https://www.cnblogs.com/LiSheng97625/p/4648739.html java web每天定时执行任务&#xff08;四步轻松搞定&#xff09; 第一步&#xff1a; 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44…

从Unity3D编译器升级聊起Mono

接前篇Unity 5.3.5p8 C#编译器升级&#xff0c;本文侧重了解一些Mono的知识。 Unity3D的编译器升级 新升级的Mono C#编译器&#xff08;对应Mono 4.4&#xff09; Unity编辑器及播放器所使用的Mono运行时还未升级。 新编译器仍针对C# 4&#xff0c;是旧的编译器也支持的版本。 …

bat脚本中获取上级目录_批处理bat命令--获取当前盘符和当前目录和上级目录

批处理命令获取当前盘符和当前目录%~d0 是当前盘符%cd% 是当前目录可以用echo %cd%进行打印测试以下例子是命令行编译Visual Studio编写的程序&#xff1a;echo offset b%cd% //将当前目录保存到参数b中,等号前后不要有空格C:cd program filescd microsoft visual studiocd com…

日期类的加减及java中所以日期类的操作算法大全

转载自 日期类的加减及java中所以日期类的操作算法大全1.计算某一月份的最大天数Calendar timeCalendar.getInstance(); time.clear(); time.set(Calendar.YEAR,year); //year 为 int time.set(Calendar.MONTH,i-1);//注意,Calendar对象默认一月为0 int daytime.getActu…

使用Spring的@Scheduled实现定时任务

https://blog.csdn.net/prisonbreak_/article/details/49180307 使用Spring的Scheduled实现定时任务 2015年10月16日 16:23:21 阅读数&#xff1a;103485更多 个人分类&#xff1a; Java开发 Spring配置文件xmlns加入 xmlns:task"http://www.springframework.org/sch…

新闻发布项目——实体类(categoryTB)

package bdqn.newsMange.entity; /*** 新闻类别实体类* author Administrator**/ public class categoryTB {private int categoryID;//编号private String categoryName;//类别名public int getCategoryID() {return categoryID;}public void setCategoryID(int categoryID) {…

.NET Core 系列5 :使用 Nuget打包类库

NuGet是个开源项目&#xff0c;项目包括 NuGet VS插件/NuGet Explorer/NuGetServer/NuGet命令行等项目&#xff0c;.NET Core项目完全使用Nuget 管理组件之间的依赖关系&#xff0c;Nuget已经成为.NET 生态系统中不可或缺的一个组件&#xff0c;从项目角度&#xff0c;将项目中…

foxmail 不知道这样的主机_华为P50真机图!网友:早知道这样,就不加价买mate40了...

hello&#xff0c;大家好&#xff0c;欢迎收看本期节目由于各方面原因&#xff0c;今年的华为mate40系列确实很难抢不少心急的用户甚至是加价买了入手之后有的用户有开始后悔了&#xff0c;当然不是该机不好而是他们看到了疑似华为P50的真机渲染图它的正面并没有丑陋的双打孔&a…