计算机网络 - 传输层

网络层只把 分组 发送到目的主机,但是真正通信的并不是主机而是主机中的进程。

传输层提供了进程间的逻辑通信,传输层向高层用户屏蔽了下面网络层的核心细节,使应用程序看起来像是在两个传输层实体之间有一条端到端的逻辑通信信道。

UDP 和 TCP 的特点

  • 用户数据报协议 UDP(User Datagram Protocol)是无连接的,尽最大可能交付,没有拥塞控制,面向报文(对于应用程序传下来的报文不合并也不拆分,只是添加 UDP 首部),支持一对一、一对多、多对一和多对多的交互通信。

  • 传输控制协议 TCP(Transmission Control Protocol)是面向连接的,提供可靠交付,有流量控制,拥塞控制,提供全双工通信,面向字节流(把应用层传下来的报文看成 字节流,把字节流组织成大小不等的报文段),每一条 TCP 连接只能是点对点的(一对一)。

何为无连接、何为面向连接

UDP 的 无连接 意味着在通信之前 不需要建立连接 (无需握手),数据包 可以直接发送 给目标地址。
TCP 的 面向连接 意味着通信双方需要按序 建立连接 (三次握手)、传输数据、 终止连接(四次挥手),保证数据的可靠传输。

UDP 首部格式


首部字段只有 8 个字节,包括源端口、目的端口、长度、检验和。12 字节的 伪首部是为了计算检验和临时添加的,即在实际的网络传输中,只有 UDP 报文段本身被传输,不包括伪头部。

伪头部的作用:仅仅是为了增加校验的准确性,提高数据传输的可靠性。在接收端,接收到的数据包中的 checksum 会与计算得到的 checksum 进行比较,以验证数据包的完整性和准确性。

需要注意的是,伪首部中的报文长度与首部中的报文长度字段一致,均表示整个 UDP 报文的长度,包括 UDP 首部长度和数据部分

TCP 首部格式


  • 序号 seq:用于对 字节流 进行编号。例如序号为 301,表示第一个字节的编号为 seq=301,如果携带的数据长度为 100 字节,那么下一个报文段的序号应为 401。

  • 确认号 ack:期望收到的下一个报文段的序号 seq。例如 B 正确收到 A 发送来的一个报文段,序号为 seq=501,携带的数据长度为 200 字节,因此 B 期望下一个报文段的序号为 701,B 发送给 A 的确认报文段中确认号就为 ack=701。

  • 数据偏移(TCP 首部长度):指的是数据 payload 部分距离报文段起始处的偏移量,即 TCP 首部的长度(1 个单位为 4 字节)。

  • 确认 ACK:当 ACK=1 时确认号字段有效,否则无效。TCP 规定,在连接建立后所有传输的报文段都必须把 ACK 置 1。

  • 同步 SYN:在 连接建立时 用来 同步序号 seq。当 SYN=1, ACK=0 时表示这是一个连接请求报文段(第一次握手)。若对方同意建立连接,则响应报文中 SYN=1, ACK=1(第二次握手)。

  • 终止 FIN:用来释放一个连接。当 FIN=1 时,表示此报文段的 发送方的数据已发送完毕,并要求释放连接

  • 窗口 window:窗口值作为接收方让发送方设置其发送窗口的依据。之所以要有这个限制,是因为 接收方的数据缓存队列是有限的

发送窗口的大小(接收方可接收的序号范围)是从接收方发送给发送方的确认报文段中的「确定号 ~ 确认号 + 窗口大小」之间的数据。

TCP 的三次握手


假设 A 为客户端,B 为服务端。

  • 首先 B 处于 LISTEN(监听)状态,等待客户的连接请求。

  • 第一次握手:A 向 B 发送连接请求报文,SYN=1, ACK=0,选择一个初始的序号 x。

  • 第二次握手:B 收到连接请求报文,如果同意建立连接,则向 A 发送连接确认报文,SYN=1, ACK=1, ack=x+1,同时也选择(随机)一个初始的 seq=y。

  • 第三次握手:A 收到 B 的连接确认报文后,还要向 B 发出确认,ACK=1, ack=y+1, seq=x+1。

  • B 收到 A 的确认后,还会回复一个确认信号,表明服务端已经准备好开始传输数据了,连接建立。

一般确认报文段中的 ack=seq+data_len,但三次握手过程中,ack=seq+1,这是因为 建立连接时的第一次、二次握手不携带应用层数据(第三次握手可以携带应用层数据)

三次握手的原因

原因一:第三次握手是 为了防止客户端已失效(过时)的连接请求报文又到达服务端,让服务端错误地二次打开连接

如果客户端发送的连接请求报文在网络中因各种原因导致了滞留,那么客户端就会隔很长一段时间才能收到服务端发回的连接确认。在客户端等待一个超时重传时间之后,就会重新请求连接 。但是,这个滞留的连接请求最后还是会到达服务端,服务端会认为这是一个 新的 连接请求。

如果不进行三次握手,服务端此时发送了确认报文段之后,就又建立了一个新的连接,并等待客户端发送数据。如果有第三次握手,客户端会忽略服务端后续发送的对滞留连接请求的连接确认,不再进行第三次握手,因此就不会再次打开连接。

原因二:如果没有第三次握手,服务端不知道自己的连接确认报文段是否有成功发送给客户端。三次握手,服务端会等待客户端的第三次握手,如果第三次握手迟迟不来,服务端就会释放相关资源(分配的队列缓存、变量等)。

TCP 的四次挥手


以下描述不讨论序号和确认号,因为序号和确认号的规则比较简单。并且不讨论 ACK,因为 ACK 在连接建立之后都为 1。

  • A 发送连接释放报文,FIN=1

  • B 收到之后发出确认,此时 TCP 属于 半关闭状态,B 能向 A 发送数据,但是 A 不能向 B 发送数据

  • 当 B 不再需要连接时,发送连接释放报文,FIN=1

  • A 收到之后发出确认,进入 TIME-WAIT 状态,等待 2 MSL(最大报文存活时间)后释放连接。

  • B 收到 A 的确认后释放连接。

四次挥手的原因

客户端发送了 FIN 连接释放报文之后,服务端收到了这个报文,就进入了 CLOSE-WAIT 状态。这个状态是 为了让服务端发送还未传送完毕的数据,传送完毕之后,服务端会发送 FIN 连接释放报文。

TIME_WAIT

客户端接收到服务端的 FIN 报文后进入该状态,此时并不是直接进入 CLOSED 状态,还需要等待 2 倍最长 segment 生命期 2MSL。这么做有两个理由:

  • 可靠地实现 TCP 全双工连接的终止(彻底终止某个连接上两个方向的数据流),即确保最后一个 ACK 确认报文能够到达服务端。如果服务端没收到客户端发送来的 ACK 确认报文,那么服务端就会重新发送 FIN 连接释放请求报文,客户端等待一段时间就是为了处理这种情况的发生。

  • 等待一段时间也是为了 让本连接持续时间内所产生的所有报文都从网络中消失,使得下一个新的连接不会出现旧的连接请求报文。

TCP 可靠传输

TCP 使用超时重传来实现可靠传输:如果一个已经发送的报文段在超时时间内没有收到确认,那么就重传这个报文段。

一个报文段从发送再到接收到服务端的确认报文段,所经过的时间称为 往返时间(Round Trip Time, RTT),加权平均往返时间 RTTs 计算如下:

RTTs:=(1α)(RTTs)+αRTTRTTs := (1-\alpha)*(\overline{RTTs})+\alpha*RTT

其中,RTTs\overline{RTTs} 为多个 RRT 的平均值,α\alpha 的典型值为 0.125。

重传超时时间(Retransmission Time Out, RTO)应该略大于 RTTs,TCP 使用的超时时间计算如下:

RTO=RTTs+4RTTdRTO=RTTs+4*RTT_d

RTTd:=(1β)RTTd+βRTTRTTsRTT_d := (1-\beta)RTT_d + \beta |RTT-RTTs|

其中,RTTdRTT_d 为偏差的加权平均值。

TCP 滑动窗口

窗口是缓存的一部分,用来暂时存放字节流。发送方和接收方各有一个窗口,接收方通过 TCP 报文段中的窗口字段告诉发送方自己的窗口大小,发送方根据这个值和其它信息设置自己的窗口大小

发送窗口内的字节 都允许被发送 ,接收窗口内的字节 都允许被接收 。如果发送窗口左部的字节已经发送并且收到了确认,那么就将发送窗口向右滑动一定距离, 直到左部第一个字节不是已发送并且已确认的状态;接收窗口的滑动类似,接收窗口左部字节已经发送确认并交付主机,就向右滑动接收窗口。


接收窗口 只会对窗口内最后一个按序到达的字节进行确认。例如,接收窗口已经收到的字节为 {31, 34, 35},其中 {31} 按序到达,而 {34, 35} 就不是,因此只对字节 31 进行确认。发送方得到一个字节的确认之后,就知道这个字节之前的所有字节都已经被接收。

对于未被确认的字节 {34, 35} ,接收方会将它们存储在接收缓冲区中,并等待后续的字节按序到达。

  • 一旦后续的字节按序到达,接收方就可以继续处理这些字节
  • 如果接收方在一定时间内 没有收到后续字节或者发生了丢包等问题,那么接收方可以选择 发送一个重传请求,要求发送方重新发送这些未被确认的字节。这样可以确保数据的可靠传输。

TCP 流量控制

流量控制是为了 控制发送方发送速率,保证接收方来得及接收

接收方发送的确认报文中的窗口字段可以用来控制发送方窗口大小,从而影响发送方的发送速率。将窗口字段设置为 0,则发送方不能发送数据。

TCP 拥塞控制

如果网络出现拥塞,分组将会丢失,此时发送方会继续重传,从而导致网络拥塞程度更高。因此 当出现拥塞时,应当控制发送方的速率 。这一点和流量控制很像,但是出发点不同。 流量控制是为了让接收方能来得及接收,而拥塞控制是为了降低整个网络的拥塞程度


TCP 主要通过四个算法来进行拥塞控制:慢开始、拥塞避免、快重传、快恢复

发送方需要维护一个叫做拥塞窗口(cwnd)的状态变量 。注意拥塞窗口与发送方窗口的区别: 拥塞窗口只是一个状态变量,实际决定发送方能发送多少数据的是发送方窗口大小。

为了便于讨论,做如下假设:

  • 接收方有足够大的接收缓存,因此不会发生流量控制;
  • 虽然 TCP 的窗口基于字节,但是这里设窗口的大小单位为报文段。

1. 慢开始与拥塞避免

发送的最初执行 慢开始,令 cwnd = 1,发送方只能发送 1 个报文段;当收到确认后,将 cwnd 加倍,因此之后发送方能够发送的报文段数量为:2、4、8 …

注意到 慢开始每个轮次都将 cwnd 加倍 ,这样会让 cwnd 增长速度非常快,从而使得发送方的发送速度增长过快,网络拥塞的可能性也就更高。 设置一个慢开始门限 ssthresh,当 cwnd >= ssthresh 时,进入拥塞避免,每个轮次只将 cwnd 加 1

如果出现了 超时,则令 ssthresh = cwnd / 2,然后重新执行慢开始

2. 快重传与快恢复

在接收方,要求每次接收到报文段都应该对最后一个已收到的有序报文段进行确认 。例如已经接收到 M1 和 M2,此时收到 M4,应当 依旧 发送对 M2 的确认。

在发送方,如果收到三个重复确认,那么可以知道下一个报文段丢失,此时 执行快重传,立即重传下一个报文段。例如收到三个 M2,则 M3 丢失,立即重传 M3

在这种情况下,只是丢失个别报文段,而不是网络拥塞。因此 执行快恢复,令 ssthresh = cwnd / 2 ,cwnd = ssthresh,注意到此时直接进入拥塞避免。<- 上图 5-25 的序号 ④ ⑤ 及之后。

慢开始和快恢复的 快慢指的是 cwnd 的设定值,而不是 cwnd 的增长速率。慢开始 cwnd 设定为 1,而快恢复 cwnd 设定为 ssthresh。


本文修改自:https://github.com/CyC2018/CS-Notes