woaidongmao

文章均收录自他人博客,但不喜标题前加-[转贴],因其丑陋,见谅!~
随笔 - 1469, 文章 - 0, 评论 - 661, 引用 - 0
数据加载中……

HTTP请求模型和头信息参考,很全

一、连接至Web服务器

一个客户端应用(如Web浏览器)打开到Web服务器的HTTP端口的一个套接字(缺省为80)。

例如:http://www.myweb.com:8080/index.html, Java中,这将等同于代码:

Soceet socket=new Socket("www.myweb.com",8080);

InputStream in=socket.getInputStream();

OutputStream out=socket.getOutputStream();

 

 

二、发送HTTP请求

通过连接,客户端写一个ASCII文本请求行,后跟0或多个HTTP头标,一个空行和实现请求的任意数据。

一个请求由四个部分组成:请求行、请求头标、空行和请求数据

 

1.请求行:请求行由三个标记组成:请求方法、请求URIHTTP版本,它们用空格分隔。

例如:GET /index.html HTTP/1.1

HTTP规范定义了8种可能的请求方法:

l        GET            检索URI中标识资源的一个简单请求

l        HEAD          GET方法相同,服务器只返回状态行和头标,并不返回请求文档

l        POST           服务器接受被写入客户端输出流中的数据的请求

l        PUT            服务器保存请求数据作为指定URI新内容的请求

l        DELETE        服务器删除URI中命名的资源的请求

l        OPTIONS       关于服务器支持的请求方法信息的请求

l        TRACE         Web服务器反馈Http请求和其头标的请求

l        CONNECT      已文档化但当前未实现的一个方法,预留做隧道处理

 

2.请求头标:由关键字/值对组成,每行一对,关键字和值用冒号(:)分隔。

请求头标通知服务器有关于客户端的功能和标识,典型的请求头标有:

l        User-Agent        客户端厂家和版本

l        Accept            客户端可识别的内容类型列表

l        Content-Length     附加到请求的数据字节数

 

3.空行:最后一个请求头标之后是一个空行,发送回车符和退行,通知服务器以下不再有头标。

 

4.请求数据:使用POST传送数据,最常使用的是Content-TypeContent-Length头标。

 

 

三、服务端接受请求并返回HTTP响应

Web服务器解析请求,定位指定资源。服务器将资源副本写至套接字,在此处由客户端读取。

一个响应由四个部分组成;状态行、响应头标、空行、响应数据

 

1.状态行:状态行由三个标记组成:HTTP版本、响应代码和响应描述。

l        HTTP版本:向客户端指明其可理解的最高版本。

l        响应代码:3位的数字代码,指出请求的成功或失败,如果失败则指出原因。

l        响应描述:为响应代码的可读性解释。

例如:HTTP/1.1 200 OK

HTTP响应码:

1xx:信息,请求收到,继续处理

2xx:成功,行为被成功地接受、理解和采纳

3xx:重定向,为了完成请求,必须进一步执行的动作

4xx:客户端错误:

 

2.响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。

 

3.空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。

 

4.响应数据:HTML文档和图像等,也就是HTML本身。

 

 

四、服务器关闭连接,浏览器解析响应

1.浏览器首先解析状态行,查看表明请求是否成功的状态代码。

 

2.然后解析每一个响应头标,头标告知以下为若干字节的HTML

 

3.读取响应数据HTML,根据HTML的语法和语义对其进行格式化,并在浏览器窗口中显示它。

 

4.一个HTML文档可能包含其它需要被载入的资源引用,浏览器识别这些引用,对其它的资源再进行额外的请求,此过程循环多次。

 

 

五、无状态连接

HTTP模型是无状态的,表明在处理一个请求时,Web服务器并不记住来自同一客户端的请求。

 

 

六、实例

1.浏览器发出请求

GET /index.html HTTP/1.1

服务器返回响应

HTTP /1.1 200 OK

Date: Apr 11 2006 15:32:08 GMT

Server: Apache/2.0.46(win32)

Content-Length: 119

Content-Type: text/html

 

<HTML>

<HEAD>

<LINK REL="stylesheet" HREF="index.css">

</HEAD>

<BODY>

<IMG SRC="image/logo.png">

</BODY>

</HTML>

 

2.浏览器发出请求

GET /index.css HTTP/1.1

服务器返回响应

HTTP /1.1 200 OK

Date: Apr 11 2006 15:32:08 GMT

Server: Apache/2.0.46(win32)

Connection: Keep-alive, close

Content-Length: 70

Content-Type: text/plane

 

h3{

    font-size:20px;

    font-weight:bold;

    color:#005A9C;

}

 

3.浏览器发出请求

GET image/logo.png HTTP/1.1

服务器返回响应

HTTP /1.1 200 OK

Date: Apr 11 2006 15:32:08 GMT

Server: Apache/2.0.46(win32)

Connection: Keep-alive, close

Content-Length: 1280

Content-Type: text/plane

 

{Binary image data follows}

 

 

七、附录

四种不同类型的头标:

l        通用头标:即可用于请求,也可用于响应,是作为一个整体而不是特定资源与事务相关联。

l        请求头标:允许客户端传递关于自身的信息和希望的响应形式。

l        响应头标:服务器和于传递自身信息的响应。

l        实体头标:定义被传送资源的信息。即可用于请求,也可用于响应。

 

头标格式:<name>:<value><CRLF>

下表描述在HTTP/1.1中用到的头标

 

l        Accept定义客户端可以处理的媒体类型,按优先级排序,在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept: image/jpeg,image/png,*/*

 

l        Accept-Charset 定义客户端可以处理的字符集,按优先级排序;在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept-Charset: iso-8859-1,*,utf-8

 

l        Accept-Encoding定义客户端可以理解的编码机制。例如:Accept-Encoding:gzip,compress

 

l        Accept-Language定义客户端乐于接受的自然语言列表。例如:Accept-Language: en,de

 

l        Accept-Ranges一个响应头标,它允许服务器指明:将在给定的偏移和长度处,为资源组成部分的接受请求。该头标的值被理解为请求范围的度量单位。例如Accept-Ranges: bytesAccept-Ranges: none

 

l        Age允许服务器规定自服务器生成该响应以来所经过的时间长度,以秒为单位。该头标主要用于缓存响应。例如:Age: 30

 

l        Allow一个响应头标,它定义一个由位于请求URI中的次源所支持的HTTP方法列表。例如:Allow: GET,PUT

 

l        aUTHORIZATION一个响应头标,用于定义访问一种资源所必需的授权(域和被编码的用户ID与口令)。例如:Authorization: Basic YXV0aG9yOnBoaWw=

 

l        Cache-Control一个用于定义缓存指令的通用头标。例如:Cache-Control: max-age=30

 

l        Connection一个用于表明是否保存socket连接为开放的通用头标。例如:Connection: closeConnection: keep-alive

 

l        Content-Base一种定义基本URI的实体头标,为了在实体范围内解析相对URLs。如果没有定义Content-Base头标解析相对URLs,使用Content-Location URI(存在且绝对)或使用URI请求。例如:Content-Base: Http://www.myweb.com

 

l        Content-Encoding一种介质类型修饰符,标明一个实体是如何编码的。例如:Content-Encoding: zip

 

l        Content-Language用于指定在输入流中数据的自然语言类型。例如:Content-Language: en

 

l        Content-Length指定包含于请求或响应中数据的字节长度。例如:Content-Length:382

 

l        Content-Location指定包含于请求或响应中的资源定位(URI)。如果是一绝。对URL它也作为被解析实体的相对URL的出发点。例如:Content-Location: http://www.myweb.com/news

 

l        Content-MD5实体的一种MD5摘要,用作校验和。发送方和接受方都计算MD5摘要,接受方将其计算的值与此头标中传递的值进行比较。例如:Content-MD5: <base64 of 128 MD5 digest>

 

l        Content-Range随部分实体一同发送;标明被插入字节的低位与高位字节偏移,也标明此实体的总长度。例如:Content-Range: 1001-2000/5000

 

l        Contern-Type标明发送或者接收的实体的MIME类型。例如:Content-Type: text/html

 

l        Date发送HTTP消息的日期。例如:Date: Mon,10PR 18:42:51 GMT

 

l        ETag一种实体头标,它向被发送的资源分派一个唯一的标识符。对于可以使用多种URL请求的资源,ETag可以用于确定实际被发送的资源是否为同一资源。例如:ETag: "208f-419e-30f8dc99"

 

l        Expires指定实体的有效期。例如:Expires: Mon,05 Dec 2008 12:00:00 GMT

 

l        Form一种请求头标,给定控制用户代理的人工用户的电子邮件地址。例如:From: webmaster@myweb.com

 

l        Host被请求资源的主机名。对于使用HTTP/1.1的请求而言,此域是强制性的。例如:Host: www.myweb.com

 

l        If-Modified-Since如果包含了GET请求,导致该请求条件性地依赖于资源上次修改日期。如果出现了此头标,并且自指定日期以来,此资源已被修改,应该反回一个304响应代码。例如:If-Modified-Since: Mon,10PR 18:42:51 GMT

 

l        If-Match如果包含于一个请求,指定一个或者多个实体标记。只发送其ETag与列表中标记区配的资源。例如:If-Match: "208f-419e-308dc99"

 

l        If-None-Match如果包含一个请求,指定一个或者多个实体标记。资源的ETag不与列表中的任何一个条件匹配,操作才执行。例如:If-None-Match: "208f-419e-308dc99"

 

l        If-Range指定资源的一个实体标记,客户端已经拥有此资源的一个拷贝。必须与Range头标一同使用。如果此实体自上次被客户端检索以来,还不曾修改过,那么服务器只发送指定的范围,否则它将发送整个资源。例如:Range: byte=0-499<CRLF>If-Range:"208f-419e-30f8dc99"

 

l        If-Unmodified-Since只有自指定的日期以来,被请求的实体还不曾被修改过,才会返回此实体。例如:If-Unmodified-Since:Mon,10PR 18:42:51 GMT

 

l        Last-Modified指定被请求资源上次被修改的日期和时间。例如:Last-Modified: Mon,10PR 18:42:51 GMT

 

l        Location对于一个已经移动的资源,用于重定向请求者至另一个位置。与状态编码302(暂时移动)或者301(永久性移动)配合使用。例如:Location: http://www2.myweb.com/index.jsp

 

l        Max-Forwards 一个用于TRACE方法的请求头标,以指定代理或网关的最大数目,该请求通过网关才得以路由。在通过请求传递之前,代理或网关应该减少此数目。例如:Max-Forwards: 3

 

l        Pragma一个通用头标,它发送实现相关的信息。例如:Pragma: no-cache

 

l        Proxy-Authenticate类似于WWW-Authenticate,便是有意请求只来自请求链(代理)的下一个服务器的认证。例如:Proxy-Authenticate: Basic realm-admin

 

l        Proxy-Proxy-Authorization类似于授权,但并非有意传递任何比在即时服务器链中更进一步的内容。例如:Proxy-Proxy-Authorization: Basic YXV0aG9yOnBoaWw=

 

l        Public列表显示服务器所支持的方法集。例如:Public: OPTIONS,MGET,MHEAD,GET,HEAD

 

l        Range指定一种度量单位和一个部分被请求资源的偏移范围。例如:Range: bytes=206-5513

 

l        Refener一种请求头标域,标明产生请求的初始资源。对于HTML表单,它包含此表单的Web页面的地址。例如:Refener: http://www.myweb.com/news/search.html

 

l        Retry-After一种响应头标域,由服务器与状态编码503(无法提供服务)配合发送,以标明再次请求之前应该等待多长时间。此时间即可以是一种日期,也可以是一种秒单位。例如:Retry-After: 18

 

l        Server一种标明Web服务器软件及其版本号的头标。例如:Server: Apache/2.0.46(Win32)

 

l        Transfer-Encoding一种通用头标,标明对应被接受方反向的消息体实施变换的类型。例如:Transfer-Encoding: chunked

 

l        Upgrade允许服务器指定一种新的协议或者新的协议版本,与响应编码101(切换协议)配合使用。例如:Upgrade: HTTP/2.0

 

l        User-Agent定义用于产生请求的软件类型(典型的如Web浏览器)。例如:User-Agent: Mozilla/4.0(compatible; MSIE 5.5; Windows NT; DigExt)

 

l        Vary一个响应头标,用于表示使用服务器驱动的协商从可用的响应表示中选择响应实体。例如:Vary: *

 

l        Via一个包含所有中间主机和协议的通用头标,用于满足请求。例如:Via: 1.0 fred.com, 1.1 wilma.com

 

l        Warning用于提供关于响应状态补充信息的响应头标。例如:Warning: 99 www.myweb.com Piano needs tuning

 

l        www-Authenticate一个提示用户代理提供用户名和口令的响应头标,与状态编码401(未授权)配合使用。响应一个授权头标。例如:www-Authenticate: Basic realm=zxm.mgmt

posted on 2008-05-29 16:48 肥仔 阅读(1621) 评论(0)  编辑 收藏 引用 所属分类: HTTP & URL


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   博问   Chat2DB   管理