以前虽然学校有学习过计算机网络,但是平时接触网络编程比较少,因此我对计算机网络只有个大概的印象。什么OSI七层模型,TCP/IP四层模型这样表面的东西。但是到底哪七层哪四层?这两个模型有什么关系?TCP、UDP、FTP、HTTP这些协议到底是什么?又是什么关系?带着这些问题我开始从网上查找资料进行学习,并整理成这篇博文。
1.OSI七层模型
开放系统互连参考模型 (Open System Interconnect 简称OSI)是国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合制定的开放系统互连参考模型,为开放式互连信息系统提供了一种功能结构的框架。它从低到高分别是:物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。
这里不详细说明OSI七层模型,附一张非常详细的图。

OSI 七层模型通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯,因此其最主要的功能就是帮助不同类型的主机实现数据传输 。
完成中继功能的节点通常称为中继系统。在OSI七层模型中,处于不同层的中继系统具有不同的名称。
一个设备工作在哪一层,关键看它工作时利用哪一层的数据头部信息。网桥工作时,是以MAC头部来决定转发端口的,因此显然它是数据链路层的设备。
物理层:网卡,网线,集线器,中继器,调制解调器
数据链路层:网桥,交换机(MAC)
网络层:路由器(IP)
网关工作在第四层传输层及其以上
集线器是物理层设备,采用广播的形式来传输信息。 交换机就是用来进行报文交换的机器。多为链路层设备(二层交换机),能够进行地址学习,采用存储转发的形式来交换报文.。 路由器的一个作用是连通不同的网络,另一个作用是选择信息传送的线路。选择通畅快捷的近路,能大大提高通信速度,减轻网络系统通信负荷,节约网络系统资源,提高网络系统畅通率。
常见的数据单元如下: 物理层 比特(bit)
数据链路层: 帧(frame)
网络层: 数据报/包 (packet)
运输层: 数据段(segment)
会话层、表示层、应用层:一般就称呼为消息(message)
数据链路层的PDU叫做Frame(帧);
网络层的PDU叫做Packet(数据包);
TCP的叫做Segment(数据段);
UDP的叫做Datagram。(数据报)——和网络层的Packet区别开,太过理论了,不讨论。
2.TCP/IP协议簇
互联网协议族(Internet Protocol Suite,缩写IPS)是一个网络通信模型,以及一整个网络传输协议家族, 为互联网的基础通信架构。它常被通称为TCP/IP协议族(TCP/IP Protocol Suite,或TCP/IP Protocols), 简称TCP/IP。 TCP/IP提供点对点的链接机制,将数据应该如何封装、定址、传输、路由以及在目的地如何接收,都加以标 准化。它通常将软件通信过程抽象化为四个抽象层,采取协议堆栈的方式,分别实现出不同通信协议。协议套组下的各种协议,依其功能不同,被分别归属到这四个层次结构之中,常被视为是简化的七层OSI模型。与OSI对应关系如下:

在上面,通常我们是把TCP/IP协议族分为四层,但是如果是五层的话就是在链路层下再加个物理层。下面是对各层的详细介绍。

3.TCP/UDP
从上面的学习我们可以知道TCP和UDP协议都属于TCP/IP模型中的传输层协议。
(1)TCP
TCP(Transmission Control Protocol,传输控制协议)是面向连接的协议,也就是说,在收发数据前,必须和对方建立可靠的连接。一个TCP连接必须要经过三次“对话”才能建立起来,其中的过程非常复杂,只简单的描述下这三次对话的简单过程:
(1) 第一次握手:建立连接时,客户端发送syn包(syn=j)到服务器,并进入SYN_SENT状态,等待服务器确认;SYN:同步序列编号(Synchronize Sequence Numbers)。
(2) 第二次握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时自己也发送一个SYN包(syn=k),即SYN+ACK包,此时服务器进入SYN_RECV状态;
(3) 第三次握手 :客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=k+1),此包发送完毕,客户端和服务器进入ESTABLISHED状态,完成三次握手。 关于需要握手三次的理解:TCP是一种可靠的传输,所以建立连接的时候也是需要保证可靠的,应答机制是必不可少的。A和B要完成一次完整的信息交互:A向B发送了一次数据,B必须告诉A自己收到数据,并且告诉一些信息给A,这就导致第二次数据的发送,当然A收到B发过来的数据,也必须告诉B自己收到了数据,所以A需要再一次发送数据给B。这三次是完成一个信息交互最基本的过程,整个过程感觉上是一问一答,有问必答的形式。
TCP建立连接要进行3次握手,而断开连接要进行4次:
(1) 当主机A完成数据传输后,将控制位FIN置1,提出停止TCP连接的请求
(2) 主机B收到FIN后对其作出响应,确认这一方向上的TCP连接将关闭,将ACK置1
(3) 由B 端再提出反方向的关闭请求,将FIN置1
(4) 主机A对主机B的请求进行确认,将ACK置1,双方向的关闭结束。
为什么需要分为四次的原因: 这是因为服务端的LISTEN状态下的SOCKET当收到SYN报文的建连请求后,它可以把ACK和SYN(ACK起应答作用,而SYN起同步作用)放在一个报文里来发送。但关闭连接时,当收到对方的FIN报文通知时,它仅仅表示对方没有数据发送给你了;但未必你所有的数据都全部发送给对方了,所以你可以未必会马上会关闭SOCKET,也即你可能还需要发送一些数据给对方之后,再发送FIN报文给对方来表示你同意现在可以关闭连接了,所以它这里的ACK报文和FIN报文多数情况下都是分开发送的。
下面用两张图更为简洁明了地展示三次握手和四次挥手:
三次握手:

四次挥手:

(2)UDP
(1) UDP是一个非连接的协议,传输数据之前源端和终端不建立连接,当它想传送时就简单地去抓取来自应用程序的数据,并尽可能快地把它扔到网络上。在发送端,UDP传送数据的速度仅仅是受应用程序生成数据的速度、计算机的能力和传输带宽的限制;在接收端,UDP把每个消息段放在队列中,应用程序每次从队列中读一个消息段。
(2) 由于传输数据不建立连接,因此也就不需要维护连接状态,包括收发状态等,因此一台服务机可同时向多个客户机传输相同的消息。
(3) UDP信息包的标题很短,只有8个字节,相对于TCP的20个字节信息包的额外开销很小。
(4) 吞吐量不受拥挤控制算法的调节,只受应用软件生成数据的速率、传输带宽、源端和终端主机性能的限制。
(5) UDP使用尽最大努力交付,即不保证可靠交付,因此主机不需要维持复杂的链接状态表(这里面有许多参数)。
(6) UDP是面向报文的。发送方的UDP对应用程序交下来的报文,在添加首部后就向下交付给IP层。既不拆分,也不合并,而是保留这些报文的边界,因此,应用程序需要选择合适的报文大小。 我们经常使用“ping”命令来测试两台主机之间TCP/IP通信是否正常,其实“ping”命令的原理就是向对方主机发送UDP数据包,然后对方主机确认收到数据包,如果数据包是否到达的消息及时反馈回来,那么网络就是通的。
(3)小结TCP/UDP区别
1.基于连接与无连接;
2.对系统资源的要求(TCP较多,UDP少);
3.UDP程序结构较简单;
4.流模式与数据报模式 ;
5.TCP保证数据正确性,UDP可能丢包,TCP保证数据顺序,UDP不保证。
注: 关于第4点不同的解释: 用UDP协议发送时,用sendto函数最大能发送数据的长度为:65535-20-8=65507字节,其中20字节为IP包头长度,8字节为UDP包头长度。用sendto函数发送数据时,如果指的的数据长度大于该值,则函数会返回错误。 用TCP协议发送时,由于TCP是数据流协议,因此不存在包大小的限制(暂不考虑缓冲区的大小),这是指在用send函数时,数据长度参数不受限制。而实际上,所指定的这段数据并不一定会一次性发送出去,如果这段数据比较长,可能会被分段发送,如果比较短,可能会等待和下一次数据一起发送。 关于第5点不同的解释: 多线程的调度问题,先发的后调度,后发的先调度,以及路由选择的不同路径都可能造成UDP数据到达的无序性。
(4) TCP粘包拆包与UDP丢包
(1) TCP粘包拆包
TCP是数据流传输,没有边界。为了效率,TCP接受到应用数据不是马上发送到网络,而是根据默认使用的Nagle算法来进行缓存。简单的说,如果一个数据包太大,就会进行拆包,然后先发送部分。如果几个数据包太小,则拼接起来一起发送。 对于处理粘包的关键在于提前获取到数据包的长度,无论这个长度是提前商定好的还是写在在数据包的开头。 详细可以看这篇博客。
(2) UDP丢包
上面讲到,UDP不保证可靠的交付。因为网络、接收方、发送方一些原因,会导致包的丢失。因为UDP丢包的原因比较复杂,这里不详细讨论了。
4.Socket
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。 Socket 接口是TCP/IP网络的API,Socket接口定义了许多函数或例程,用以开发TCP/IP网络上的应用程序。粗俗的讲,Socket只是方便我们实现TCP/UDP的工具类。