有时候,Web 服务器生成 HTTP Response 是无法在 Header 就确定消息大小的,这时一般来说服务器将不会提供
Content-Length 的头信息,而采用 Chunked 编码动态的提供 body 内容的长度。
进行 Chunked 编码传输的 HTTP Response 会在消息头部设置:
Transfer-Encoding: chunked
表示 Content Body 将用 Chunked 编码传输内容。
Chunked 编码使用若干个 Chunk 串连而成,由一个标明长度为 0 的 chunk 标示结束。每个 Chunk 分为头部和正文
两部分,头部内容指定下一段正文的字符总数(十六进制的数字)和数量单位(一般不写),正文部分就是指定长度的
实际内容,两部分之间用回车换行(CRLF)隔开。在最后一个长度为 0 的 Chunk 中的内容是称为 footer 的内容,是一
些附加的 Header 信息(通常可以直接忽略)。具体的 Chunk 编码格式如下:
Chunked-Body = *chunk
"0" CRLF
footer
CRLF
chunk = chunk-size [ chunk-ext ] CRLF
chunk-data CRLF
hex-no-zero = <HEX excluding "0">
chunk-size = hex-no-zero *HEX
chunk-ext = *( ";" chunk-ext-name [ "=" chunk-ext-value ] )
chunk-ext-name = token
chunk-ext-val = token | quoted-string
chunk-data = chunk-size(OCTET)
footer = *entity-header
RFC 文档中的 Chunked 解码过程如下:
length := 0
read chunk-size, chunk-ext (if any) and CRLF
while (chunk-size > 0) {
read chunk-data and CRLF
append chunk-data to entity-body
length := length + chunk-size
read chunk-size and CRLF
}
read entity-header
while (entity-header not empty) {
append entity-header to existing header fields
read entity-header
}
Content-Length := length
Remove "chunked" from Transfer-Encoding
最后提供一段 PHP 版本的 chunked 解码代码: