6.应用层
应用层
概述
应用层解决应用进程的交互来实现特定网络应用的问题,是计算机网络体系结构的最顶层,是设计和建立计算机网络的最终目的
客户服务器方式和对等方式
网络应用程序运行在处于网络边缘的不同的端系统,通过彼此间的通信来共同完成某项任务
开发一种新的网络应用首先要考虑的问题就是网络应用程序在各种端系统上的组织方式和他们之间的关系
目前主要流行的是以下两种:
- 客户/服务器(Client/Server,C/S)方式
- 对等(Peer-to-Peer,P2P)方式
客户/服务器就是指通信中所涉及的两个应用进程
客户是服务请求方,服务器是服务提供方
服务器总是处于运行状态,并等待客户的服务请求,服务器具有固定端口号(例如HTTP服务器的默认端口号为80),而运行服务器的主机也具有固定的IP地址
C/S方式是因特网上传统的,同时也是最成熟的方式,很多网络应用采用的就是C/S方式
基于C/S方式的应用程序通常是服务集中型的,即应用服务集中在网络中比客户计算机少得多的服务器计算机上
- 由于一台服务器计算机要为多个客户机提供服务,在C/S应用中,常会出现服务器计算机跟不上众多客户机请求的情况
- 为此,在C/S应用中,常用计算机集群来构建一个强大的虚拟服务器
对等方(Peer-to-Peer)方式
在P2P方式中,没有固定的服务请求者和服务提供者,分布在网络边缘各端系统中的应用进程是对等的,被称为对等方。对等方相互之间直接通信,每个对等方既是服务的请求者,又是服务的提供者
基于P2P的应用是服务分散型的,因为服务不是集中在少数几个服务器中,而是分散在大量对等计算机中
P2P最突出的特性之一就是它的可拓展性,因为系统每增加一个对等方,不仅增加的是服务的请求者,同时也增加恶劣服务的提供者,系统性能不会因为规模的增大而降低
P2P具有成本上的优势,因为它通常不需要庞大的服务器设置和服务器带宽
域名系统DNS
域名系统DNS(Domain Name System)是因特网使用的命名系统,用来把便于人们记忆的具有特定含义的主机名,转为方便于机器处理的IP地址
DNS使用的是UDP连接,因为UDP速度快于TCP
当我们在浏览器地址栏中输入某个Web服务器的域名时,用户主机会首先在自己的DNS高速缓存中查找该域名所对应的IP地址,如果没有找到,则会向网络中某台DNS服务器查询,DNS服务器中有域名和IP地址的映射数据库
因特网采用层次树状结构的域名结构
域名的结构由若干个分量组成,各分量之间用点隔开,分别代表不同级别的域名
- 每一级的域名都由英文字母和数字组成,不超过63个字符,不区分大小写
- 级别最低的域名写在最左边,而级别最高的顶级域名写在最右边
- 完整的域名不超过255个字符
域名系统既不规定一个域名需要包含多少个下级域名,也不规定每一级的域名代表了什么意思
各级域名由其上一级的域名管理结构管理,而最高的顶级域名则由因特网名称与数字地址分配机构ICANN进行管理
顶级域名TLD(Top Level Domain)分为以下三类:
- 国际顶级域名nTLD 采用ISO 3166的规定,如cn表示中国,us表示美国等
通用顶级域名gTLC 最常用的通用顶级域名有7个,即:com(公司企业),net(网络服务机构),org(非营业性组织),int(国际组织),edu(美国教育结构),gov(美国政府部门),mil(美国军事机构)
反向域arpa 用于反向域名解析,即IP地址反向解析为域名
在国家顶级域名下注册的二级域名均由该国家自行确定
我国将二级域名划分为以下两类:
- 类别域名 共7个 :ac(科研机构),com(工,商,金融等企业),edu(教育机构),gov(政府部门),net(提供网络服务的机构),mil(军事机构)和org(非盈利性组织)
- 行政区域名:共34个,适用于我国的各省,自治区,直辖市等等
域名和IP地址的映射关系必须保存在域名服务器中,供其他应用查询,DNS使用分布在各地的域名服务器来实现域名到IP地址的转换
域名服务器可以划分为以下四种不同的类型:
- 根域名服务器
根域名服务器是最高层次的域名服务器,每个根服务器都知道所有的顶级域名服务器的域名及其IP地址,因特网共有13个不同IP地址的根域名服务器,根域名服务器通常不直接对域名进行解析,而是返回该域名所属顶级域名的顶级域名服务器的IP地址
- 顶级域名服务器
这些域名服务器负责管理该顶级域名服务器注册的所有二级域名
- 权限域名服务器
这些域名服务器负责管理某个区的域名,每个主机的域名都必须在某个权限域名服务器处注册登记,因此权限域名服务器知道其管辖的域名与IP地址的映射关系,另外,权限域名服务器还知道其下级域名服务器的地址
- 本地域名服务器
本地域名服务器不属于上述的域名服务器的等级结构,当一个主机发出DNS请求报文时,这个报文首先被送往该主机的本地域名服务器,本地域名服务器起着代理的作用,会将该报文转发到上述的域名服务器的等级结构中,有时被称为默认域名服务器
域名解析的过程
- 递归查询
本地域名服务器直接询问根域名服务器,然后根域名服务器再层层向下询问,得到信息后,原路返回
- 迭代查询
通过本地域名服务器向直接向根域名服务器查询,然后根域名服务器告诉本地域名服务器下级的域名服务器的地址
由于递归查询对于被查询的域名服务器负担太大,通常采用以下模式:
从请求主机到本地域名服务器的查询是递归查询,而其余的查询是迭代查询
为了提高DNS的查询效率,并减轻根域名服务器的负荷和减少因特网上的DNS查询报文数量,在域名服务器广泛使用了告诉缓存。高速缓存用来存放查询过的域名以及从何处获得域名映射消息的记录
DNS查询的最少次数是0(命中高速缓存),DNS查询的最多次数取决于域名长度
由于域名到IP地址的映射关系并不是永久不变,为保持高速缓存中的内容,域名服务器应为每项内容设计计时器并删除超过合理时间的项
文件传送协议FTP
将某台计算机中的文件通过网络传送到可能相距很远的另一台计算机中,是一项基本的网络应用,就是文件传送
文件传送协议(File Transfer Protocol)是因特网上使用得最广泛的文件传送协议
- FTP提供交互式的访问,允许客户指明文件的类型和格式,并允许文件具有存储权限
- FTP屏蔽了各个计算机的细节,因而适合在异构网络中任意计算机之间传送文件
FTP的常见用途是在计算机之间传输文件,尤其是用于批量传输文件
FTP的另一个常见用途是让网站设计者将构成网络内容的大量文件批量上传到他们的Web服务器
FTP的基本工作原理
主动模式
FTP随机选择一个临时端口号,与FTP服务器的熟知端口号建立TCP连接,用来传送控制命令,当有数据要传输的时候,FTP客户通过FTP服务器来与自己的另一个临时端口号建立TCP连接,建立数据通道,这种模式称为主动模式,建立数据通道时,FTP服务器主动连接FTP客户
控制连接在整个会话过程中一直保持打开,用于传送FTP相关控制命令
数据连接用于文件传输,在每次文件传输时才建立,传输结束就关闭
被动模式
当有数据要传输时,FTP客户通过命令通道告知FTP服务器开启某个临时端口被动等待TCP连接,建立数据通道,这种模式称为被动模式,建立数据通道时,FTP被动等待FTP客户的连接
电子邮件
电子邮件系统采用客户/服务器方式
电子邮件系统的三个主要组成构件:用户代理,邮件服务器,以及电子邮件所需的协议
- 用户代理是用户与电子邮件系统的接口,又称为电子邮件客户端软件
- 邮件服务器是电子邮件系统的基础设施,因特网上所有的ISP都有邮件服务器,其功能是发送和接收邮件,同时还要负责维护用户的邮箱
- 协议包括邮件发送协议(例如STMP)和邮件读取协议(例如POP3,IMAP)
简单邮件传送协议SMTP(Simple Mail Transfer Protocol)的基本工作原理
发送方会周期性地对邮件进行缓存扫描,如果发现有邮件,则会和SMTP服务器进行TCP连接,端口号为25,之后SMTP客户就可以通过该连接对SMTP服务器发送相关的控制命令,SMTP也会给SMTP客户发送相应的应答,共21种
电子邮件的信息格式并不是由SMTP定义的,而是在RFC 822中单独定义,一个电子邮件有信封和内容两部分,而内容又由首部和主体两部分构成
SMTP协议只能传送ASCII码文本数据,不能传送可执行文件或其他的二进制对象
SMTP不能满足多媒体邮件的需要,并且许多其他国家的文字也无法用SMTP传送
为了解决SMTP传送非ASCII码文本的问题,提出了多用途因特网拓展MIME(Multipurpose Internet Mail Extensions),可以将非ASCII码的内容转换为ASCII码的形式
- 增加了5个新的邮件首部字段,这些字段提供了有关邮件主体的信息
- 定义了许多邮件内容的格式,对多媒体电子邮件的表示方法进行了标准化
- 定义了传送编码,可对任何内容格式进行转换,而不会被邮件系统改变
常见的邮件读取协议
邮局协议POP(Post Office Protocol):非常简单功能有限的邮件读取协议,用户只能以下载并删除方式或下载并保留方式从邮件服务器下载邮件到用户方计算机,不允许客户在邮件服务器上管理自己的邮件
因特网邮件访问协议IMAP(Internet Message Access Protocol):功能比POP3强大的邮件读取协议,用户在自己计算机上就可以操控邮件服务器中的邮箱,就像在本地操控一样,因此IMAP是一个联机协议
POP3和IMAP4都采用基于TCP连接的客户/服务器方式,POP3使用熟知端口110,IMAP使用熟知端口143
现在越来越多的人使用万维网的电子邮件,通过浏览器登录邮件服务器万维网网站就可以撰写,收发,阅读邮件
用户可以通过用一个邮箱服务器,之间通过HTTP超文本链接协议发送信息
不同的邮件服务器之间也可以通过SMTP进行传送
万维网WWW
万维网WWW(World Wide Web)并非某种特殊的计算机网络,它是一个大规模,联机式的信息储存所,是运行在因特网上的一个分布式应用
利用网页之间的超链接将不同网站的网页链接成一张逻辑上的信息网
浏览器最重要的部分是渲染引擎,也就是浏览器内核,负责对网页内容进行解析和显示
为了方便地访问在世界范围的文档,万维网使用统一资源定位符URL来指明因特网上任何种类资源的位置
URL由以下4个部分组成:
<协议>://<主机>:<端口>/<路径>
万维网的文档由超文本标记语言HTML,层叠样式表CSS,脚本语言JavaScript
超文本传输协议HTTP(HyperText Transfer Protocol)
定义了浏览器怎样向万维网服务器请求万维网文档,以及万维网服务器怎样把万维网文档传送给浏览器
HTTP/1.0采用非持续连接方式,在该方式下,每次浏览器请求一个文件都要与服务器建立TCP连接,收到响应后立即关闭连接
- 每请求一个文档就要有两倍的RTT的开销
- 为了减少时延,浏览器通常会建立多个并行的TCP连接同时请求多个对象,但是这样会大量占用万维网服务器的资源
HTTP/1.1采用持续连接方式,在该方式下,万维网服务器在发送响应后仍然保持这条连接,使同一个客户和该服务器可以继续在这条连接上传送HTTP请求报文和响应报文
HTTP的报文格式
HTTP是面向文本的,其报文的每一个字段都是一些ASCII码串,并且每个字段的长度都是不确定的
万维网使用Cookie在服务器上记录用户信息
- 早期的万维网应用非常简单,仅仅是用户查看存放在不同服务器上的各种静态文档,因此HTTP被设计为一种无状态的协议,这样可以简化服务器的设计
- Cookie提供了一种机制使得万维网服务器能够记住用户,而无需用户主动提供用户标识信息,也就是说,Cookie是一种对无状态的HTTP进行状态化的技术
万维网缓存和代理服务器
- 在万维网中还可以使用缓存机制来提高万维网的效率
- 万维网缓存又称为Web缓存(Web Cache),位于中间系统上的Web缓存又称为代理服务器
- Web缓存把最近一些请求和响应暂存在本地磁盘中,当新请求到达时,若发现这个请求与展示存放的记录相同,就返回暂存的响应,而不需要按URL的地址再次去因特网访问该资源
HTTP连接分为持续连接和非持续连接
持续连接又分为非流水的持续连接和流水的持续连接
如果用户向服务器请求数据,比如说3个图片和1个网页
- 非流水的持续连接
需要5个RTT时间+4个对象的传输时间
- 流水的持续连接
需要3个RTT时间+4个对象的传输时间
非持续连接
需要8个RTT+4对象传输时间