协议
为进行网络中的数据交换而建立的规则、标准或约定(=语义+语法+规则)。
不同层具有不同的协议
OSI/ISO七层参考模型
OSI(Open Systern Interconnection)参考模型将网络的不同功能划分为7层。
分层 协议
应用层 ————处理网络应用 远程登录协议Telnet、文件传输协议FTP 、
超文本传输协议HTTP、域名服务DNS、
简单邮件传输协议SMTP、邮局协议POP3等
表示层 ————数据表示
会话层 ———— 主机间通信
传输层 ————端到端的连接 传输控制协议TCP(面向连接的可靠连接协议)、
用户数据报协议UDP (无连接的不可靠连接协议)
网络层 ————寻址和最短路径 网际协议IP、Internet互联网控制报文协议ICMP、
Internet组管理协议IGMP
数据链路层 ———— 介质访问(接入)
物理层 ————二进制传输
通信实体的对等层之间不允许直接通信。
各层之间是严格单向依赖。
上层(Server User)使用下层提供的服务。
下层(Server Provider)向上层提供服务。
对等层通信的实质:
对等层之间虚拟通信。
下层向上层提供服务,实际通信在最底层完成。
数据封装
一台计算机要发送数据到另一台计算机,数据首先必须打包,
打包的过程称为封装。
封装就是在数据前面加上特定的协议头部,或者在数据后面加上特定的协议尾部。
OSI参考模型中。对等层协议之间交换的信息单元统称为协议数据单元(PDU,Protocal Data Unit)
OSI参考模型中每一层都要依靠下一层提供的服务。
为了提供服务,下层把上层的PDU作为本层的数据来封装,然后加入本层的头部(和尾部)。
头部中含有完成数据传输所需的控制信息。
这样,数据自上而下递交的过程实际上就是不断封装的过程。
到达目的地后自下而上递交的过程,就是不断拆封的过程。
由此可知,在物理线路上传输的数据,其外在实际上被包封了多层“信封”。
但是,某一层只能识别由对等层封装的“信封”,
而对于被封装在“信封”内部的数据仅仅是拆封后将其提交给上层,
本层不做任何处理。
TCP/IP模型
TCP/IP模型包含4个层次:
应用层
传输层
网络层
网络接口
TCP/IP与OSI参考模型的对应关系
TCP/IP模型 OSI模型
应用层 应用层
表示层
会话层
传输层 传输层
网络层 网络层
网络接口 数据链路层
物理层
端口
按照OSI七层模型的描述,传输层提供进程(应用程序)通信的能力。
为了能标示通信实体中进行通信的进程,TCP/IP协议提出了协议端口(protocal port,简称端口)的概念。
端口是一种抽象的软件结构(包括一些数据结构和I/O缓冲区)。
应用程序通过系统调用与某端口建立连接(binding)后,传输层传给该端口的数据都被相应的进程所接收,
相应进程发给传输层的数据都通过该端口输出。
端口用一个整数型标识符来表示,即端口号。
端口号和协议相关,TCP/IP传输层的2个协议TCP和UDP是完全独立的2个软件模块,因此各自的端口号相互独立。
端口使用一个16位的数字来表示,它的范围是0~65535
数字比1024小的端口保留给预定义的服务。例如:http使用80端口。
套接字(socket)的引入
为了能方便的开发网络应用软件,由美国伯克利大学在Unix上推出了一种应用程序访问通信协议的操作系统调用socket(套接字)。socket的出现,让程序员可以很方便的访问TCP/IP,从而开发各种网络应用程序。
随着Unix的应用推广,套接字在编写网络软件中得到了极大的普及。
后来,套接字又被引入到Windows等操作系统,成为开发网络应用程序的非常有效快捷的工具。
套接字存在于通信区域中。
通信区域也叫地址族,它是一个抽象的概念,主要用于将通过套接字通信的进程的共有特性综合在一起。
套接字通常只和同一区域的套接字交换数据(也可能跨区域通信,但只在执行了某种转换进程后才可以)。
Windows Sockets只支持一个通信区域:网际域(AF_INET),这个域被使用网际协议簇通信的进程使用。
网络字节顺序
不同的计算机存放多字节值的顺序不同,
有的机器在起始地址存放低位字节(低位先存),比如基于Inter的CPU,即我们常用的PC机。
有的机器在起始地址存放高位字节(高位先存)。
为保证传输数据的正确性,在网络协议中需指定网络字节顺序。
TCP/IP协议使用16位整数和32位整数的高位先存格式。
客户机/服务器模式
在TCP/IP网络应用中,通信的2个进程间相互作用的主要模式是客户机/服务器模式(client/server),
即客户向服务器提出请求,服务器接收到请求后,提供相应的服务。
客户机/服务器模式的建立基于2点:
1。建立网络的原因是网络中软硬件资源、运算能力和信息不对称等,需要共享,
从而造就拥有众多资源的主机提供服务,资源较少的客户请求服务这一非对等作用。
2.网间进程通信完全是异步的,相互通信的进程间即不存在父子关系,又不共享内存缓冲区,
因此需要一种机制为希望通信的进程建立联系,为2者的数据交换提供同步,
这就是基于客户机/服务器模式的TCP/IP。
客户机/服务器模式在操作过程中采用的是主动请求的方式。
服务器:
首先服务器方要先启动,并根据请求提供相应的服务:
1.打开一个通信通道并告知本地主机,它愿意在某一地址及端口上接收客户请求。
2.等待客户请求到达该端口。
3.接收到重复服务请求,处理该请求并发送应答信号。
接收到并发服务请求,要激活一个新的进程(或线程)来处理这个客户的请求。
新进程(或线程)处理此客户请求,并不需要对其它请求作出应答。
服务完成后,关闭此新进程与客户的通信链路,并终止。
4.返回第2步,等待另一客户请求。
5.关闭服务器。
客户机:
1.打开一个通信信道,并连接到服务器所在主机的指定端口。
2.向服务器发请求报文,等待并接收应答;继续提出请求。
3.请求结束后,关闭通信信道并终止。
Windows Sockets的实现
Windows Sockets是Microsoft Windows的网络程序设计接口,
它是从Berkeley Sockets展而来的,以动态链接库的形式提供给我们使用。
Windows Sockets在继承了Berkeley Sockets主要特征的基础上,又对它进行了扩充。
这些扩充主要是提供了一些异步函数,并增加了符合Windows消息驱动特性的网络事件异步选择机制。
Windows Sockets 1.1和Berkeley Sockets都是基于TCP/IP的。
Windows Sockets 2 从Windows Sockets 1.1发展而来,与协议无关并向下兼容,
可以使用任何底层传输协议提供的通信能力,来为上层应用程序完成网络数据通讯,
而不关心底层网络链路的通信情况,真正实现了底层网络通讯对应用程序的透明(?)。
套接字的类型
1.流式套接字(SOCK_STREAM)
提供面向连接、可靠的数据传输服务,数据无差错无重复的发送,且按发送顺序接收。
2.数据报套接字(SOCK_DGRAM)
提供无连接服务。数据包以独立包形式发送,数据可能丢失、重复,且接收顺序混乱。
3.原始套接字(SOCK_RAM)
基于TCP(面向连接)的socket编程
服务器端程序:
1.创建套接字(socket)。
2.将套接字绑定到一个本地地址和端口上(bind)。
3.将套接字设为监听模式,准备接收客户请求(listen)。
4.等待客户请求到来;当请求到来后,接收连接请求,返回一个新的对应于此次连接的套接字(accept)。
5.用返回的套接字和客户端进行通信(send/recv)。
6.返回,等待另一客户请求。
7.关闭套接字(close)。
客户端程序:
1.创建套接字(socket)。
2.向服务器发出连接请求(connect)。
3.和服务器端进行通信(send/recv)。
4.关闭套接字 (close)。
基于(UDP)面向无连接的socket编程
服务器端程序:
1.创建套接字(socket)。
2.将套接字绑定到一个本地地址和端口上(bind)。
3.等待接收数据(recvfrom)。
4.关闭套接字(close)。
客户端程序:
1.创建套接字(socket)。
2.向服务器发送数据(sendto)。
3.关闭套接字(close)。
相关函数说明
int WSAStartup(WORD wVersionRequested , LPWSADATA lpWSAData);
wVersionRequested参数用于指定准备加载的Winsock库的版本。
高位字节指定所需要的Winsock库的副版本,而低字节则是主版本。
可用MAKEWORD( x , y )(其中x是高位字节,y是低位字节)方便地获得wVersionRequested的正确值。
lpWSAData参数是指向WSADATA结构的指针,
WSAStartup用其加载的库版本有关的信息填在这个结构中。
WSADATA结构定义如下:
typedef struct WSADate
{
WORD wVersion;
WORD wHighVersion;
char szDescription [WSADESCRIPTION_LEN+1];
char szSystemStatus[WSASYS_STATUS_LEN+1];
unsigned short iMaxSockets;
unsigned short iMaxUdpDg;
char FAR* lpVendorInfo;
}WSADATA, *LPWSADATA;
WSAStartup把第一个字段wVersion设成打算使用的Winsock的版本,wHighVersion参数容纳的是现有的Winsock库的最高版本。记住,两个字段中,高位字节代表的是Winsock副版本,而低字节代表的是Winsock库的主版本。szDescription和szSystemStatus这两个字段由特定的Winsock实施方案设定,事实上没有用。不要使用下面这两个字段:iMaxSocks和iMaxUdpDg.,它们是假定同时最多可打开多少套接字和数据报的最大长度。然而,要知道数据报的最大长度应该通过WSAEnumProtocols关。最后,lpvendorInfo字段是为Winsock实施方案有关的指定厂商信息预留的。任何一个Win32平台上都没有使用这个字段。
如果Winsock.dll或底层网络子系统没有被正确初始化或没有被找到,WSAStartup将返回WSASYSNOTREADY。此外这个函数允许你的应用程序协商使用某种版本的Winsock规范,如果请求的版本等于或高于DLL所支持的最高版本与请求版本中较小的那个。反之,如果请求的版本低于DLL所支持的最低版本,WSAStartup将返回WSAVERNOTSUPPORTED。关于WSAStartup更详细的信息,请查阅MSDN中的相关部分。
对于每一个WSAStartup的成功调用(成功加载Winsock DLL后),在最后都对应一个WSACleanUp调用,以便释放为该应用程序分配的资源。
SOCKET socket(int af, int type, int protocal);
该函数接收3个参数。
第一个参数af指定地址族,对于TCP/IP协议的套接字,它只能是AF_INET(也可写成PF_INET)。
第二个参数指定Socket类型,对于1.1版本的Socket,它只支持2种类型的套接字,SOCK_STREAM指定产生流式套接字,SOCK_DGRAM产生数据报套接字。
第三个参数是与特定地址家族相关的协议,自动为你选择一个合适的协议。这是推荐使用的一种选择协议的方法。
如果这个函数调用成功,它将返回一个新的SOCKET数据类型的套接字描述符。如果调用失败,这个函数就会返回一个INVALID_SOCKET,错误信息可以通过WSAGEtLastError函数返回。
int bind(SOCKET s, const struct sockaddr FAR * name, int namelen);
第一个参数s指定要绑定的套接字,
第二个参数指定了该套接字的本地地址信息,是指向sockaddr结构的指针变量,由于该地质结构是为所有的地址家族准备的,这个结构可能(通常会)随所使用的网络协议不同而不同,所以,
要用第三个参数指定该地址结构的长度。
sockaddr结构定义如下:
struct sockaddr
{
u_short sa_family;
char sa_data[14];
}
sockaddr的第一个字段sa_family指定该地址家族,在这里必须设为
AF_INET.sa_data仅仅是表示要求一块内存分配区,起到占位的作用,该区域中指定与协议相关的具体地址信息。由于实际要求的只是内存区,所以对于不同的协议家族,用不同的结构来替换 sockaddr。除了sa_family外,sockaddr是按网络字节顺序表示的。在TCP/IP中,我们可以用sockaddr_in结构替换sockaddr,以方便我们填写地址信息。
sockaddr_in的定义如下:
struct sockaddr_in
{
short sin_family;
unsigned short sin_port;
struct in_addr sin_addr;
char sin_size[8];
}
其中,sin_family表示地址族,对于IP地址,sin_family成员将一直是AF_INET。成员sin_port指定的是将要分配给套接字的端口。成员sin_addr给出的是套接字的主机IP地址。而成员sin_zero只是一个填充数,以使sockaddr_in结构和sockaddr结构的长度一样。如果这个函数调用成功,它将返回0。如果调用失败,这个函数就会返回一个SOCKET_ERROR,错误信息可以通过WSAGetLastError函数返回。
将IP地址指定为INADDR_ANY,允许套接字向任何分配给本地机器的IP地址发送或接收数据。多数情况下,每个机器只有一个IP地址,但有的机器可能会有多个网卡,每个网卡都可有自己的IP,用INADDR_ANY可以简化应用程序的编写。将地址指定为INADDR_ANY,允许一个独立应用接受发自多个接口的回应,如果我们只想让套接字使用多个IP中的一个,就必须指定实际地址,要做到这一点,可以用inet_addr()函数,这个函数需要一个字符串做为其参数,该字符串指定了以点分十进制格式表示的IP地址(如:192.168.0.16).而且inet_addr()函数会返回一个适合分配给S_addr的u_long类型的数值。inet_ntoa()函数会完成相反的转换,它接受一个in_addr结构类型的参数并返回一个以点分十进制格式表示的IP地址字符串。