系统相关
首页 > 系统相关> > 由Linux中listen()函数谈开去

由Linux中listen()函数谈开去

作者:互联网

由Linux中listen()函数谈开去

一、简介

1. 前言

  本篇博文主要谈一谈Linux系统中,在使用socket套接字建立Tcp连接时,关于listen()函数的backlog参数的理解,同时,借由该问题,并结合具体的实践,尝试厘清Tcp连接的建立过程。
  本篇博客编写主要参考借鉴了以下两篇博文,并在其基础上,加入了个人的一些思考与探索。

  1. 深入探索 Linux listen() 函数 backlog 的含义

  2. How TCP backlog works in Linux

  下述内容的讨论,建立在对Tcp/Ip、socket有一定了解的基础上,相关的知识点,可以参考以下博文:

1.揭开Socket编程的面纱
2.Linux Socket编程(不限Linux)

2. 问题引入

  当我们尝试在Linux上通过Socket建立一个服务器,并接收客户端的连接请求时,服务器端程序通常需要执行以下流程:

  1. 使用创建 socket() 创建一个监听描述符ListenFd
  2. 使用 bind()ListenFd绑定一个本地的地址,以便于其它的socket(套接字),能够与其建立连接
  3. 使用 listen()ListenFd设置为被动模式——表明自己乐意接受连接请求,并设置【连接建立队列的限制】。
  4. 调用 accept() 以接收具体的连接。
  5. 数据交互。。。

  服务器与客户端通过调用相关函数建立连接的流程如下所示:

C/S连接建立过程
图1:Tcp连接实现

注:在上图中,并未展示断开连接的过程

  在平时的工程实践中,自己也都是照猫画虎, 知其然而不知其所以然。由于最近尝试写一个使用TCP构建的客户端/服务器公共框架的框架,在写作过程中,发现自己对于很多基础的操作都不明其意,基于此,才有了这边博文。
  文章首先介绍socket的一些基本概念,接下来通过一个具体的实例,并结合相应的抓包分析,印证实际与理论是否相符。

二、原理介绍

1. Tcp三次握手

  在学习计算机网络的相关知识时,想必大家对于Tcp三次握手的连接过程并不陌生:

socket中发送的TCP三次握手
图2: Tcp三次握手

  正如上图所示:

  1. 客户端请求建立连接,然后进入 SYN-SENT 状态
  2. 处于LISTEN状态的服务器端在收到连接请求后,给客户端回复应答,同时进入SYN-RCVD状态
  3. 客户端在收到应答后,进入ESTABLISHED状态,同时再次发消息告知服务器端
  4. 服务器端在收到消息后,亦即进入ESTABLISHED状态

  在完成上述交互过程后,Tcp 连接建立,两者即可进行后续的数据交互。
  以上为建立连接的逻辑过程,看起来清晰易懂,似乎没有什么难以理解的地方,但是,倘若需要我们将三次握手过程与图一的实现联系起来呢?
  根据自己以往的经验,具体的实现,与Tcp三次握手的原理图,应该是如下的对应关系:

关于Tcp三次握手实现的错误的理解
图3: Tcp三次握手实现的错误理解

  对于客户端而言:在调用connect()后进入SYN-SENT状态,同时阻塞,以等待服务器应答;在接收到应答后,则进入ESTABLISHED状态。
注:调用socket()connect()之间的这段状态,我们暂且将其称为INIT状态
  对于服务器而言:调用listen()后进入LISTEN状态,在调用accept()接收客户端的连接请求后,会短暂的进入SYN-RCVD状态,随后进入ESTABLISHED状态。
注:调用socket()listen()之间的这段状态,我们暂且将其称为INIT状态
  图中的状态划分,粗看的话,似乎也说的过去,完整体现了三次握手的过程,但事实是否真的如此呢?在展开具体的说明之前,首先需要对listen()函数进行介绍。

2. 关于backlog参数的理解

int listen(int sockfd, int backlog);

  listen()sockfd对应的描述符标记为被动模式,所谓被动模式的意思也就是说,可以用accept()来接受收到的连接请求。其中,backlog参数指定列了挂起连接队列可以增长的最大长度。
  正如上文所说的,由于Tcp通过三次握手建立连接,一个连接在成功建立并进入ESTABLISHED状态前,会经历一段短暂的SYN-RCVD状态,之后就可以被accept()系统调用处理,并返回给应用。这意味着Tcp/Ip协议栈拥有两种方式来实现处于LISTEN状态的socket套接字的backlog队列:

  The implementation uses a single queue, the size of which is determined by the backlog argument of the listen syscall. When a SYN packet is received, it sends back a SYN/ACK packet and adds the connection to the queue. When the corresponding ACK is received, the connection changes its state to ESTABLISHED and becomes eligible for handover to the application. This means that the queue can contain connections in two different state: SYN RECEIVED and ESTABLISHED. Only connections in the latter state can be returned to the application by the accept syscall.
——《How TCP backlog works in Linux

  实现使用单个队列,其尺寸由listen()backlog参数决定。处于被动模式的socket在收到一个SYN报文后,它返回一个SYN/ACK报文,并将该链接加入队列。在收到相应的ACK应答报文后,此连接将状态改为ESTABLISHED,此后,才有资格被移交给应用程序(注:才可以用于后续的交互)。以上也就意味着,该队列可能同时包含处于SYN-RCVD以及ESTABLISHED两种状态的连接。只有处于后一种状态的连接,方可以被accept()处理,并返回给用户。

  The implementation uses two queues, a SYN queue (or incomplete connection queue) and an accept queue (or complete connection queue). Connections in state SYN RECEIVED are added to the SYN queue and later moved to the accept queue when their state changes to ESTABLISHED, i.e. when the ACK packet in the 3-way handshake is received. As the name implies, the accept call is then implemented simply to consume connections from the accept queue. In this case, the backlog argument of the listen syscall determines the size of the accept queue.
——《How TCP backlog works in Linux

  此种实现使用两个队列:SYN队列(连接未完成队列),以及accept队列(已完成连接的队列)。SYN-RCVD状态的连接被加入SYN队列,当连接状态变为ESTABLISHED后,则被移入到accept队列(例如,在接收到三次握手中的ACK报文时)。顾名思义,accept()调用,其实现就是为了接受来自accept队列的连接(注:所谓接受连接,意即该连接已经建立,可以通过调用accept()被返回给用户,并用于后续交互。随后,该连接也就被从accept队列中移除)。对于此种方式,listen()调用的backlog参数,决定了accept队列的大小。

  Historically, BSD derived TCP implementations use the first approach. That choice implies that when the maximum backlog is reached, the system will no longer send back SYN/ACK packets in response to SYN packets. Usually the TCP implementation will simply drop the SYN packet (instead of responding with a RST packet) so that the client will retry.
  The BSD implementation does use two separate queues, but they behave as a single queue with a fixed maximum size determined by (but not necessary exactly equal to) the backlog argument:

The queue limit applies to the sum of […] the number of entries on the incomplete connection queue […] and […] the number of entries on the completed connection queue […].

——《How TCP backlog works in Linux

  从历史上看,派生自BSD的Tcp实现使用第一种方案。该选择意味着,当队列达到backlog所定义的最大值时,系统不会发送SYN/ACK报文去回应SYN报文。通常,Tcp实现只会丢弃SYN报文(而不是应答RST报文),以便客户端可以重试。
  BSD实现确实是用两个队列,然而它们的行为就如同是由backlog参数决定大小的单个队列。
  队列限制适用于未完成连接队列的条目数与已完成连接条目数的总和。

On Linux, things are different, as mentioned in the man page of the listen syscall:

The behavior of the backlog argument on TCP sockets changed with Linux 2.2. Now it specifies the queue length for completely established sockets waiting to be accepted, instead of the number of incomplete connection requests. The maximum length of the queue for incomplete sockets can be set using /proc/sys/net/ipv4/tcp_max_syn_backlog.

——《How TCP backlog works in Linux

  在Linux上,情况则有所不同,以下是man page中关于listen系统调用的内容:
  Tcp socket的backlog参数的行为在Linux2.2中有所改变。它现在指定了等待被接受的连接已完成的套接字的队列(注:即accept队列)的长度,而不是未完成的连接请求的个数(注:即SYN队列中所包含的连接个数)。 未完成连接队列的最大长度可以被设定为/proc/sys/net/ipv4/tcp_max_syn_backlog
  为了验证实际是否与上述理论是一致的,我们将在下文中通过具体的例程,并结合具体的抓包数据,对Tcp的连接过程进行分析。

三、实验与分析

1. 实验环境

处理器名称:Intel® Core™ i3-4170 CPU @ 3.70GHz
系统版本:CentOS release 6.5 (Final)
编译器版本:gcc version 4.4.7 20120313

2. 例程介绍

  实验使用的例程包括ClientServer两部分,具体地址详见

#include<stdio.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>
#include<arpa/inet.h>
#include<string.h>
#include<strings.h>
#include<stdlib.h>
#include<unistd.h>
#include<pthread.h>
#include <stdarg.h>
#include <sys/errno.h>
#include <iostream>
#include <sstream>

#define PORT 17777
#define THREAD_NUM 6  //定义创建的线程数量
#define MAXLINE 1024
struct sockaddr_in stServAddr;
using namespace std;
/**
*@brief 格式化错误信息
*
*
*@param int errnoflag
*@param int error
*@param const char *fmt
*@param va_list ap
*
*@return
* 
*
*@author Litost_Cheng
*@date 2019年1月21日
*@note 新生成函数
*/
static void ErrDoit(int errnoflag, int error, const char *fmt, va_list ap)
{
	char	buf[MAXLINE];

	vsnprintf(buf, MAXLINE-1, fmt, ap);
	if (errnoflag)
		snprintf(buf + strlen(buf), MAXLINE - strlen(buf) - 1, ": errno[%d] %s",
				 error, strerror(error));
	strcat(buf, "\n");
	fflush(stdout);		/* in case stdout and stderr are the same */
	fputs(buf, stderr);
	fflush(NULL);		/* flushes all stdio output streams */
}

/**
*@brief 判断条件,打印errno并退出
*
*
*@param bool bCondition
*@param const char *fmt
*@param ...
*
*@return 
* 
*
*@author Litost_Cheng
*@date 2019年5月11日
*@note 新生成函数
*
*/
bool CondJudgeExit(bool bCondition, const char *fmt, ...)
{
    if (!bCondition)
    {
		va_list 	ap;
		va_start(ap, fmt);
		ErrDoit(1, errno, fmt, ap);
		va_end(ap);
		exit(1);
    }
    return bCondition;
}

void *func(void *) 
{
    int nConnFd;
    nConnFd = socket(AF_INET,SOCK_STREAM,0);
    printf("nConnFd : %d\n",nConnFd);

    ///在没个子线程中,都会尝试与服务器连接连接,并返回结果
    if ((connect(nConnFd,(struct sockaddr *)&stServAddr,sizeof(struct sockaddr_in)) == -1))
    {
        printf("[nConnFd] Connect failed: [%s]\n", strerror(errno));
        return (void *)-1;
    }
    else
    {
	    printf("Connect succeed!\n");
        stringstream strStream;
        strStream << "[" << nConnFd << "]" << "Send Message"; 
        printf("strStream is [%s]\n", strStream.str().c_str());
        if (-1 == write(nConnFd, strStream.str().c_str(), strStream.str().size()))
        {
            printf("[nConnFd] Connect failed: [%s]\n", strerror(errno));
            return (void *)-1;
        }
        else
        {
            printf("[nConnFd] Send succeed!\n", nConnFd);
        }
        

    }

    while(1) {}
}

int main(int argc,char *argv[])
{

    memset(&stServAddr,0,sizeof(struct sockaddr_in));
    stServAddr.sin_family = AF_INET;
    stServAddr.sin_port = htons(PORT);
    inet_aton("127.0.0.1",(struct in_addr *)&stServAddr.sin_addr); 

    //创建线程并且等待线程完成
    pthread_t nPid[THREAD_NUM];
	//system("netstat -atn | grep '17777'");
	//printf("netstat -atn\n");
    for(int i = 0 ; i < THREAD_NUM; ++i)
    {
        pthread_create(&nPid[i],NULL,&func,NULL);

    }



	sleep(3);
	//system("netstat -atn | grep '17777'");
	//printf("netstat -atn\n");
    for(int i = 0 ; i < THREAD_NUM; ++i)
    {
        pthread_join(nPid[i], NULL);
    }

    return 0;
}

  以上,为了搞清backlog参数的真实含义,客户端进程会创建THREAD_NUM个线程,来向服务器端发起连接请求,并返回相应的结果。

#include<stdio.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<sys/time.h>
#include<netinet/in.h>
#include<arpa/inet.h>
#include<errno.h>
#include<stdlib.h>
#include<string.h>
#include<unistd.h>
#include <string>
#include <stdarg.h>
#include <sys/errno.h>
#include <iostream>
#define PORT  17777    //端口号
#define BACKLOG 2     //BACKLOG大小
#define MAXLINE 1024


using namespace std;
/**
*@brief 格式化错误信息
*
*
*@param int errnoflag
*@param int error
*@param const char *fmt
*@param va_list ap
*
*@return
* 
*
*@author Litost_Cheng
*@date 2019年1月21日
*@note 新生成函数
*/
static void ErrDoit(int errnoflag, int error, const char *fmt, va_list ap)
{
	char	buf[MAXLINE];

	vsnprintf(buf, MAXLINE-1, fmt, ap);
	if (errnoflag)
		snprintf(buf + strlen(buf), MAXLINE - strlen(buf) - 1, ": errno[%d] %s",
				 error, strerror(error));
	strcat(buf, "\n");
	fflush(stdout);		/* in case stdout and stderr are the same */
	fputs(buf, stderr);
	fflush(NULL);		/* flushes all stdio output streams */
}

/**
*@brief 判断条件,打印errno并退出
*
*
*@param bool bCondition
*@param const char *fmt
*@param ...
*
*@return 
* 
*
*@author Litost_Cheng
*@date 2019年5月11日
*@note 新生成函数
*
*/
bool CondJudgeExit(bool bCondition, const char *fmt, ...)
{
    if (!bCondition)
    {
		va_list 	ap;
		va_start(ap, fmt);
		ErrDoit(1, errno, fmt, ap);
		va_end(ap);
		exit(1);
    }
    return bCondition;
}

/**
*@brief 展示连接信息
*
*
*@param bool bCondition
*@param const char *fmt
*@param ...
*
*@return void
* 
*
*@author Litost_Cheng
*@date 2019年5月11日
*@note 新生成函数
*
*/
void Display()
{
	system("netstat -atn | grep '17777' | sort -n -t : -k 2");

	printf("netstat -atn | grep '17777' | sort -n -t : -k 2\n");

	//system("lsof -nP -iTCP | grep '17777'");
	//printf("lsof -nP -iTCP | grep '17777'\n");

}

char *pCmd[5];
int main(int argc,char *argv[])
{
    int nConLen;
    int nSockFd,nConnFd;
    struct sockaddr_in stServAddr,stConnAddr;
	int nCmd = 0;
	pCmd[0] = "socket";
	pCmd[1] = "bind";
	pCmd[2] = "listen";
	pCmd[3] = "accept_once";
	pCmd[4] = "accept_times";
	
	printf("Please input the Cmd: \n");
	for(int n=0; n<5; n++)
	{
		printf("\t[%d]: [%s]\n", n, pCmd[n]);
	}
	
	std::cin >> nCmd;

	std::string strSysCmd =  "tcpdump -i lo -s 0 -w ./Tcpdump_";
	strSysCmd += pCmd[nCmd];
	strSysCmd += ".cap";
	strSysCmd += " &";
	system(strSysCmd.c_str());
	printf("[%s]\n", strSysCmd.c_str());
	do
	{
		printf("Start:");
		Display();
		//创建套接字
		CondJudgeExit(((nSockFd = socket(AF_INET,SOCK_STREAM,0)) != -1), "Create socket failed!\n");
		if (0 == nCmd)
		{
			break;
		}
		
		//为套接字绑定地址,需要注意字节序
		memset(&stServAddr,0,sizeof(struct sockaddr_in));
		stServAddr.sin_family = AF_INET;
		stServAddr.sin_port = htons(PORT);
		stServAddr.sin_addr.s_addr = htonl(INADDR_ANY);
		
		CondJudgeExit((bind(nSockFd,(struct sockaddr *)&stServAddr,sizeof(struct sockaddr_in)) != -1), "bind failed!\n");
		if (1 == nCmd)
		{
			break;
		}
		
		//设置为被动模式	
		CondJudgeExit((listen(nSockFd,BACKLOG) != -1), "listen filed!\n");
		if (2 == nCmd)
		{
			break;
		}	

		//accept once
		nConLen = sizeof(struct sockaddr_in);
		//sleep(10);                  //sleep 10s之后接受一个连接


		//该套接字默认为阻塞模式,所以,倘若没有接受的一个成功建立的连接,则会一直阻塞在这里
		accept(nSockFd,(struct sockaddr *)&stConnAddr,(socklen_t *)&nConLen);
		
		printf("I have accept one Connect: [%s], port[%d] \n", inet_ntoa(stConnAddr.sin_addr), ntohs(stConnAddr.sin_port));
		

		
		
		if (3 == nCmd)
		{
			break;
		}

		printf("Pending on [%s]\n", pCmd[nCmd]);
		while(1)
		{
			sleep(3);                  //周期性接受连接请求
			printf("I will accept one\n");
			accept(nSockFd,(struct sockaddr *)&stConnAddr,(socklen_t *)&nConLen);
			printf("I have accept one Connect: [%s], port[%d] \n", inet_ntoa(stConnAddr.sin_addr), ntohs(stConnAddr.sin_port));

			Display();
		}		
		
	}
	while(0);
	while(1)
	{
		printf("Pending on [%s]\n", pCmd[nCmd]);
		Display();
		sleep(1);
	}

    return 0;
}

  对于服务器端进程而言,我们手动将backlog设置为BACKLOG,以判断其如何处理过量的连接;此外,为了厘清Tcp三次握手与具体实现之间的联系,该例程会根据用户输入的不同的选项,将程序阻塞在不同阶段,并结合对应时刻的连接状态以及抓包数据,确定当前连接所处的状态。
  在开始具体的实验前,有以下几点是需要我们注意的:

  1. 为了理解backlog参数的实际含义,实验过程中,我们要求Client程序中的THREAD_NUM参数应该要大于Server中的BACKLOG,以认为造成过量的连接请求。
  2. 代码的编译使用自动的makefile文件模板MakeFileTemplate,用户只需执行make命令,即可生成相应的可执行文件。
  3. 连接状态的获取使用netstat获取
  4. 抓包数据的获取使用Tcpdump,并配合Wireshark工具对抓包进行分析,关于两工具的使用,详见该链接:聊聊 tcpdump 与 Wireshark 抓包分析

3. 分步实验

在具体的实验过程中,我们会将Server分别阻塞以下几个阶段,同时会附上相应的程序输出(Client,Server),连接状态,以及抓包数据,以方便读者能够有一个直观的认识。

1. Server阻塞于socket()创建后

2. Server阻塞于bind()后

3. Server阻塞于listen()后

4. Server阻塞于accept()一次后

5. Server阻塞于accept()多次

4. 实验结果分析

  通过对以上分布实验的结果的分析,我认为在之前对于linux中Tcp三次握手实现的理解是错误的。正确的理解应该是如下图所示:

关于Tcp三次握手实现的正确的理解
图4: 关于Tcp三次握手实现的正确的理解

  主要存在以下几点误区:

  1. Server成功调用listen()后,相应的套接字——我们暂且将其称为A注:该套接字唯一作用就是用来接受连接请求),将进入被动模式,之后A其实就一直处于监听状态LISTEN
  2. Client调用connect()发起连接请求,处于监听状态的套接字A在收到连接请求后,首先会将其存储在前文提到的SYN队列,并将相应的套接字——我们将其称为B,设置为SYN-RCVD,并发送应答给Client。在收到Client后,B进入ESTABLISHED状态。但需要注意的是,此时的B应该仍位于SYN队列,只有在判断accept队列未满(小于backlog + 1)时,才会将其转移到accept队列。

  由于并未看过系统源码,以上仅是结合相应实验的到的结论,仅为个人理解,如有谬误,还望各位批评指正。此外,针对不同的系统,结果可能仍有不同。

  1. 深入探索 Linux listen() 函数 backlog 的含义:https://blog.csdn.net/yangbodong22011/article/details/60399728

  2. How TCP backlog works in Linux:http://veithen.io/2014/01/01/how-tcp-backlog-works-in-linux.html

  3. 使用TCP构建的客户端/服务器公共框架:https://github.com/0Litost0/TcpClientServerFramework

  4. MakeFileTemplate:https://github.com/0Litost0/MakeFileTemplate

  5. netstat指令:https://www.cnblogs.com/peida/archive/2013/03/08/2949194.html

  6. 聊聊 tcpdump 与 Wireshark 抓包分析:https://www.jianshu.com/p/8d9accf1d2f1

五、文档信息

作者: Litost_Cheng

发表日期:2019年05月20日
更多内容:

  1. Litost_Cheng的博客
  2. Litost_Cheng的Github

标签:17777,ESTABLISHED,127.0,0.1,nConnFd,tcp,Linux,开去,listen
来源: https://blog.csdn.net/litost000/article/details/90382114