基于混合TCP-UDP的HTTP协议实现方法_通信网络论文
关键词:tcp udp http pda
引 言
超文本传输协议(http)是目前通过internet进行信息交换最主要的方式。http协议是建立在请求/响应(request/response)模型上的。首先由客户建立一条与服务器的tcp链接,并发送一个请求到服务器,请求中包含请求方法、uri、协议版本以及相关的mime(multipurpose internet mail extensions)样式的消息。服务器响应一个状态行,包含消息的协议版本、一个成功和失败码以及相关的mime式样的消息(包含服务器的信息、资源实体的和可能的资源内容)。图1给出了http协议实现的一个简单模型。http/1.0为每一次http的请求/响应建立一条新的tcp链接,因此一个包含html内容和图片的页面将需要建立多次的短期的tcp链接。一次tcp链接的建立将需要3次握手。另外,为了获得适当的传输速度,则需要tcp花费额外的回路链接时间(rtt)。每一次链接的建立需要这种经常性的开销,而其并不带有实际有用的数据,只是保证链接的可靠性,因此http/1.1提出了可持续链接的实现方法。http/1.1将只建立一次tcp的链接而重复地使用它传输一系列的请求/响应消息,因此减少了链接建立的次数和经常性的链接开销。
可持续链接减少了每次tcp链接建立的时间,但是一个空闲的tcp链接将需要一个socket和相应的存储缓冲区。一个socket缓冲区的最小长度必须大于一个tcp包的最大长度,即64 kb,而且很多实现方法在链接建立时将预分配一些缓冲区。可用的socket的数量是有限的,很多基于bsd的操作系统对于能够同时打开的链接数都有一个缺省的最大值。
无线掌上设备pda的应用(如浏览器)特点表现在:① 因为页面是针对掌上设备制作的,一般在1 k~2 k字节,比较小;② 目前无线通信网络的带宽很窄,gsm的数据信道带宽只有9.6 k。当前web页面的访问大多通过http协议,并使用tcp作为下层的传输控制协议。但不幸的是,tcp并不适合短会话的应用情况,不同于现在采用的使用单一tcp传输协议进行数据传输的方式。本文提出了采用动态选择传输层协议(tcp、udp)的方法来改善取回页面的延迟、网络拥塞以及服务器的负荷。
这种混合tcp-udp的方法结合两个方面的优点:首先,对于需要比较少数据传输的情况,它将使用udp作为传输层的协议,从而避免了tcp链接的多次握手开销;另外,对于需要较多数据传输的情况,它将使用可靠的带有重排序和拥塞控制的tcp协议作为传输层的协议。混合tcp-udp的实现方法只需要对应用层的改动,而操作系统的核心代码不用任何更改。仅采用udp协议的缺点在于,需要在应用层建立一套类似于tcp复杂的控制协议,从而进行重排序和拥塞控制来保证传输的可靠性。
1 背 景
http是一个请求/响应协议,客户端的应用程序通过提供一个url可以从服务器上得到所需的数据。http可以用来访问各种不同类型的资源,其中包括文本、图形、影音、可执行文件、数据库查询结果等等。
图2给出了在客户端发起http get请求后,在客户端和服务器之间进行数据包交换的示意。图中只有两个数据包是有用的(即携带了数据):一个是http get请求,另一个是http的响应。其它的都是tcp用来进行握手操作的数据包。为了减轻web服务器的负荷,经常采用重定向机制。这样从服务器发来的重定向响应报文是很短的数据包。使用tcp作为传输协议需要至少7个数据包,而使用udp则只需要2个数据包就足够了。
2 设 计
我们使用混合传输层的方法即对于少量数据传输的链接采用udp,而对于大量数据传输的链接采用tcp作为传输层协议。这样对于短链接而言就避免了tcp经常性的握手开销,而对于长链接则仍可获得tcp的优点,如超时重传、拥塞控制、错误恢复机制等。这种方法中,客户端首先尝试使用udp作为传输层的协议,如果对于所请求的url udp并不适合,则再次使用tcp链接。这种方法提供了以下保证:
◇ 如果初始的udp数据包丢失,将采用tcp重新链接而不会受到影响。
◇ 如果所链接的服务器没有使用混合传输层的实现机制,客户端将使用tcp重新进行链接。
图3给出了混合tcp、udp的实现算法。一个采用混合算法的http客户端首先使用udp作为传输层的协议发出http get请求,同时启动超时定时器。
当服务器处理客户端发来的请求时,它可以从以下两点做出选择:
① 如果响应的数据足够小(比如,可放到一个数据包中),服务器将使用udp发回响应。像比较小的网页或http redirect响应就属于这一类。
② 如果响应的数据很大,无法放进一个udp数据包中,服务器则要求客户端使用tcp重试。这可以通过添加一个http的头部字段来解决如 tcpretr。
在客户端,将会出现以下三种情况:
◇ 客户端从服务器接收到响应。如果响应中包含了所需的http响应,客户端将对数据进行处理。如果服务器要求客户端重试,客户端将使用tcp作为传输层重试。
◇ 如果服务器没有处理通过udp传输的http包,客户端就会收到icmp错误消息(目的地址无法到达/协议无法到达)。此时客户端将会使用tcp重试。
◇ 如果定时器超时,客户端应使用tcp重试。
图4给出了在定时器超时情况下,客户端和服务器之间数据包的交换。这种超时机制提供了可靠性,以及与未使用混合tcp-udp方法的服务器的兼容性。
图5示意了服务器要求客户端使用tcp重发请求时,客户端和服务器之间的数据包交换。
3 结 语
混合tcp-udp方法改善了参与http传输的三个方面:客户端、服务器和网络。
◇ 对于客户端而言,可以避免由于tcp而引入的三向握手的时间,从而减少了浏览的延迟时间。
◇ 对于服务器而言,由于所需的tcp的链接数量减少,从而降低了由于建立、维护、撤销tcp链接所带来的服务器的负荷。
◇ 对于网络而言,由于tcp控制数据包的减少从而减少了网络的拥塞。