没有合适的资源?快使用搜索试试~ 我知道了~
Socket简单编程指南,网上的资源,整理了一下,主要是Socket编程的介绍,包括基本概念及相关函数功能、参数、返回值等内容。
资源推荐
资源详情
资源评论
C 语言 SOCKET 编程指南
(2016 年 1 月 7 日 14:58:21)
1、介绍
Socket 编程让你沮丧吗?从 man pages 中很难得到有用的信息吗?你想跟上时代去编
Internet 相关的程序,但是为你在调用 connect() 前的 bind() 的结构而不知所措?
等等…
好在我已经将这些事完成了,我将和所有人共享我的知识了。如果你了解 C 语言并想穿
过网络编程的沼泽,那么你来对地方了。
2、读者对象
这个文档是一个指南,而不是参考书。如果你刚开始 socket 编程并想找一本入门书,那
么你是我的读者。但这不是一本完全的 socket 编程书。
3、平台和编译器
这篇文档中的大多数代码都在 Linux 平台 PC 上用 GNU 的 gcc 成功编译过。而且它们
在 centos 平台 上用 gcc 也成功编译过。但是注意,并不是每个代码片段都独立测试过。
目录
1、介绍. 1
2、读者对象. 1
3、平台和编译器. 1
4、什么是 socket 3
5、Internet 套接字的两种类型. 4
6、网络理论. 6
7、结构体. 8
8、本机转换. 11
9、IP 地址和如何处理它们. 12
10、socket()函数. 14
11、bind()函数. 15
12、connect()程序. 17
13、listen()函数. 19
14、accept()函数. 20
15、send() and recv()函数. 22
16、sendto() 和 recvfrom()函数. 24
17、close()和 shutdown()函数. 25
18、getpeername()函数. 26
19、gethostname()函数. 27
20、域名服务(DNS). 27
21、客户-服务器背景知识. 30
22、简单的服务器. 31
23、简单的客户程序. 34
24、数据包 Sockets 37
25、阻塞. 42
26、select()--多路同步 I/O 43
27、重新回顾 TCP,UDP 47
4、什么是 socket
你经常听到人们谈论着 “socket”,或许你还不知道它的确切含义。现在让我告诉你:
它是使用标准 Unix 文件描述符 (file descriptor) 和其它程序通讯的方式。什么?
你也许听到一些 Unix 高手(hacker)这样说过:“呀,Unix 中的一切就是文件!”那个家
伙也许正在说到一个事实:Unix 程序在执行任何形式的 I/O 的时候,程序是在读或者写
一个文件描述符。一个文件描述符只是一个和打开的文件相关联的整数。但是(注意后面的
话),这个文件可能是一个网络连接,FIFO,管道,终端,磁盘上的文件或者什么其它的东
西。Unix 中所有的东西就是文件!所以,你想和 Internet 上别的程序通讯的时候,你
将要使用到文件描述符。你必须理解刚才的话。现在你脑海中或许冒出这样的念头:“那么
我从哪里得到网络通讯的文件描述符呢?”,这个问题无论如何我都要回答:你利用系统调
用 socket(),它返回套接字描述符 (socket descriptor),然后你再通过它来进行
send() 和 recv()调用。“但是...”,你可能有很大的疑惑,“如果它是个文件描述符,
那么为什 么不用一般调用 read()和 write()来进行套接字通讯?”简单的答案是:“你可
以使用!”。详细的答案是:“你可以,但是使用 send()和 recv()让你更好的控制数据传
输。”存在这样一个情况:在我们的世界上,有很多种套接字。有 DARPA Internet 地址
(Internet 套接字),本地节点的路径名 (Unix 套接字),CCITT X.25 地址 (你可以
将 X.25 套接字完全忽略)。也许在你的 Unix 机器上还有其它的。我们在这里只讲第一种:
Internet 套接字。
5、Internet 套接字的两种类型
什么意思?有两种类型的 Internet 套接字?是的。不,我在撒谎。其实还有很多,
但是我可不想吓着你。我们这里只讲两种。除了这些, 还有 "Raw Sockets" 也是非常强
大的,也值得查阅。
那么这两种类型是什么呢?一种是"Stream Sockets"(流格式),另外一种是"Datagram
Sockets"(数据包 格式 )。我们以后谈到它们的时候 也会 用到 "SOCK_STREAM" 和
"SOCK_DGRAM"。数据报套接字有时也叫“无连接套接字”(如果你确实要连接的时候可以用
connect()。) 流式套接字是可靠的双向通讯的数据流。如果你向套接字按顺序输出“1,
2”,那么它们将按顺序“1,2”到达另一边。它们是无错误的传递的,有自己的错误控制,
在此不讨论。
有什么在使用流式套接字?你可能听说过 telnet,不是吗?它就使用流式套接字。
你需要你所输入的字符按顺序到达,不是吗?同样,WWW 浏览器使用的 HTTP 协议也使用
它们来下载页面。实际上,当你通过端口 80 telnet 到一个 WWW 站点,然后输入 “GET
pagename” 的时候,你也可以得到 HTML 的内容。为什么流式套接字可以达到高质量的
数 据 传 输 ? 这 是 因 为 它 使 用 了 “ 传 输 控 制 协 议 (The Transmission Control
Protocol)”,也叫 “TCP” (请参考 RFC-793 获得详细资料。)TCP 控制你的数据按顺
序到达并且没有错 误。你也许听到 “TCP” 是因为听到过 “TCP/IP”。这里的 IP 是指
“Internet 协议”(请参考 RFC-791。) IP 只是处理 Internet 路由而已。
那么数据报套接字呢?为什么它叫无连接呢?为什么它是不可靠的呢?有这样的一些
事实:如果你发送一个数据报,它可能会到达,它可能次序颠倒了。如果它到达,那么在这
个包的内部是无错误的。数据报也使用 IP 作路由,但是它不使用 TCP。它使用“用户数
据报协议 (User Datagram Protocol)”,也叫 “UDP” (请参考 RFC-768。)
为什么它们是无连接的呢?主要是因为它并不象流式套接字那样维持一个连接。你只
要建立一个包,构造一个有目标信息的 IP 头,然后发出去。无需连接。它们通常使用于传
输包-包信息。简单的应用程序有:tftp, bootp 等等。
你也许会想:“假如数据丢失了这些程序如何正常工作?”我的朋友,每个程序在 UDP 上
有自己的协议。例如,tftp 协议每发出的一个被接受到包,收到者必须发回一个包来说“我
收到了!” (一个“命令正确应答”也叫“ACK” 包)。如果在一定时间内(例如 5 秒),发送
方没有收到应答,它将重新发送,直到得到 ACK。这一 ACK 过程在实现 SOCK_DGRAM 应
用程序的时候非常重要。
6、网络理论
既 然 我 刚 才 提 到 了 协 议 层 , 那 么 现 在 是 讨 论 网 络 究 竟 如 何 工 作 和 一 些 关 于
SOCK_DGRAM 包是如何建立的例子。当然,你也可以跳过这一段, 如果你认为已经熟悉的
话。
现在是学习数据封装 (Data Encapsulation) 的时候了!它非常非常重 要。它重
要性重要到你在网络课程学(图 1:数据封装)习中无论如何也得也得掌握它。主要 的内
容是:一个包,先是被第一个协议(在这里是 TFTP )在它的报头(也许 是报尾)包装(“封
装”),然后,整个数据(包括 TFTP 头)被另外一个协议 (在这里是 UDP )封装,然后下
一个( IP ),一直重复下去,直到硬件(物理) 层( 这里是以太网 )。
当另外一台机器接收到包,硬件先剥去以太网头,内核剥去 IP 和 UDP 头,TFTP 程序再剥
去 TFTP 头,最后得到数据。现在我们终于讲到声名狼藉的网络分层模型 (Layered
Network Model)。这种网络模型在描述网络系统上相对其它模型有很多优点。例如,你
可以写一个套接字程序而不用关心数据的物理传输(串行口,以太网,连 接单元接口 (AUI)
还是其它介质),因为底层的程序会为你处理它们。实际 的网络硬件和拓扑对于程序员来
说是透明的。
不说其它废话了,我现在列出整个层次模型。如果你要参加网络考试,可一定要记住:
应用层 (Application)
表示层 (Presentation)
会话层 (Session)
传输层(Transport)
网络层(Network)
数据链路层(Data Link)
物理层(Physical)
物理层是硬件(串口,以太网等等)。应用层是和硬件层相隔最远的--它 是用户和网络交互
的地方。
这个模型如此通用,如果你想,你可以把它作为修车指南。把它对应 到 Unix,结果是:
应用层(Application Layer) (telnet, ftp,等等)
传输层(Host-to-Host Transport Layer) (TCP, UDP)
Internet 层(Internet Layer) (IP 和路由)
网络访问层 (Network Access Layer) (网络层,数据链路层和物理层)
现在,你可能看到这些层次如何协调来封装原始的数据了。
看看建立一个简单的数据包有多少工作?哎呀,你将不得不使用 "cat" 来建立数据包头!
这仅仅是个玩笑。对于流式套接字你要作的是 send() 发 送数据。对于数据报式套接字,
你按照你选择的方式封装数据然后使用 sendto()。内核将为你建立传输层和 Internet
层,硬件完成网络访问层。这就是现代科技。
现在结束我们的网络理论速成班。哦,忘记告诉你关于路由的事情了。但是我不准备谈它,
如果你真的关心,那么参考 IP RFC。
7、结构体
终于谈到编程了。在这章,我将谈到被套接字用到的各种数据类型。因为它们中的一些
内容很重要了。
首先是简单的一个:socket 描述符。它是下面的类型:
int
仅仅是一个常见的 int。
从现在起,事情变得不可思议了,而你所需做的就是继续看下去。注意这样的事实:有两种
字节排列顺序:重要的字节 (有时叫"octet",即八 位位组) 在前面,或者不重要的字节
在前面。前一种叫“网络字节顺序 (Network Byte Order)”。有些机器在内部是按照这
个顺序储存数据,而另外 一些则不然。当我说某数据必须按照 NBO 顺序,那么你要调用
函数(例如 htons() )来将它从本机字节顺序 (Host Byte Order) 转换过来。如果我
没有 提到 NBO, 那么就让它保持本机字节顺序。
我的第一个结构(在这个技术手册 TM 中)--struct sockaddr.。这个结构 为许多类型
的套接字储存套接字地址信息:
struct sockaddr
{
unsigned short sa_family;
char sa_data[14];
};
sa_family 能够是各种各样的类型,但是在这篇文章中都是 "AF_INET"。 sa_data 包
含套接字中的目标地址和端口信息。这好像有点不明智。
为了处理 struct sockaddr,程序员创造了一个并列的结构: struct sockaddr_in
("in" 代表 "Internet"。)
struct sockaddr_in
{
short int sin_family;
unsigned short int sin_port;
struct in_addr sin_addr;
unsigned char sin_zero[8];
};
用这个数据结构可以轻松处理套接字地址的基本元素。注意 sin_zero (它被加入到这个
结构,并且长度和 struct sockaddr 一样) 应该使用函数 bzero() 或 memset() 来
全部置零。同时,这一重要的字节,一个指向 sockaddr_in 结构体的指针也可以被指向
结构体 sockaddr 并且代替它。这 样的话即使 socket() 想要的是 struct sockaddr
*,你仍然可以使用 struct sockaddr_in,并且在最后转换。同时,注意 sin_family
和 struct sockaddr 中 的 sa_family 一 致 并能够 设置为 "AF_INET" 。 最 后,
sin_port 和 sin_addr 必须是网络字节顺序 (Network Byte Order)!
你也许会反对道:"但是,怎么让整个数据结构 struct in_addr sin_addr 按照网络
字节顺序呢?" 要知道这个问题的答案,我们就要仔细的看一看这 个数据结构: struct
in_addr, 有这样一个联合 (unions):
struct in_addr
{
unsigned long s_addr;
};
它曾经是个最坏的联合,但是现在那些日子过去了。如果你声明 "ina" 是数据结构
struct sockaddr_in 的实例,那么 "ina.sin_addr.s_addr" 就储存 4 字节的 IP
地 址 ( 使 用 网 络 字 节 顺 序 ) 。 如 果 你 不 幸 的 系 统 使 用 的 还 是 恐 怖 的 联 合 struct
in_addr ,你还是可以放心 4 字节的 IP 地址并且和上面 我说的一样(这是因为使用了
“#define”。)
8、本机转换
我们现在到了新的章节。我们曾经讲了很多网络到本机字节顺序的转换,现在可以实践
了! 你能够转换两种类型: short (两个字节)和 long (四个字节)。这个函数对于变
量类型 unsigned 也适用。假设你想将 short 从本机字节顺序转换为网络字节顺序。用
"h" 表示 "本机 (host)",接着是 "to",然后用 "n" 表 示 "网络 (network)",最
后 用 "s" 表 示 "short" : h-to-n-s, 或 者 htons() ("Host to Network
Short")。
太简单了...
如果不是太傻的话,你一定想到了由"n","h","s",和 "l"形成的正确组合,例如这里
肯定没有 stolh() ("Short to Long Host") 函数,不仅在这里 没有,所有场合都
没有。但是这里有:
htons()--"Host to Network Short"
htonl()--"Host to Network Long"
ntohs()--"Network to Host Short"
ntohl()--"Network to Host Long"
现在,你可能想你已经知道它们了。你也可能想:“如果我想改变 char 的顺序要怎么办
呢?” 但是你也许马上就想到,“用不着考虑的”。你也许 会想到:我的 68000 机器已经
使用了网络字节顺序,我没有必要去调用 htonl() 转换 IP 地址。你可能是对的,但是
当你移植你的程序到别的机器 上的时候,你的程序将失败。可移植性!这里是 Unix 世界!
记住:在你将数据放到网络上的时候,确信它们是网络字节顺序的。
最后一点:为什么在数据结构 struct sockaddr_in 中, sin_addr 和 sin_port 需
要转换为网络字节顺序,而 sin_family 需不需要呢? 答案是:sin_addr 和 sin_port
分别封装在包的 IP 和 UDP 层。因此,它们必须要 是网络字节顺序。但是 sin_family
域只是被内核 (kernel) 使用来决定在数 据结构中包含什么类型的地址,所以它必须是
本机字节顺序。同时, sin_family 没有发送到网络上,它们可以是本机字节顺序。
9、IP 地址和如何处理它们
现在我们很幸运,因为我们有很多的函数来方便地操作 IP 地址。没有必要用手工计算它
们,也没有必要用"<<"操作来储存成长整字型。首先,假设你已经有了一个 sockaddr_in
结构体 ina,你有 一 个 IP 地 址 "132.241.5.10" 要 储存在 其 中,你 就 要用到 函 数
inet_addr(),将 IP 地址从 点数格式转换成无符号长整型。使用方法如下:
ina.sin_addr.s_addr = inet_addr("132.241.5.10");
剩余34页未读,继续阅读
资源评论
雨不落
- 粉丝: 49
- 资源: 9
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功