其他分享
首页 > 其他分享> > 结构体,枚举,联合

结构体,枚举,联合

作者:互联网

文章目录


本章主要学习C语言中的自定义类型,即结构体、枚举、联合。

结构体

C语言本身具有的内置类型:

char 
short 
int 
long
long long
float
double

但是对于复杂对象,C语言怎么描述?

结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。

为什么要有结构?

生活中有很多复杂对象,比如我们需要描述一个人,要有姓名、年龄、身高、体重等等,描述一座城市,要有地名、占地面积、旅游景点、特色小吃等等,C语言内置类型并不能满足要求,我们就需要使用自定义类型来描述。

结构体类型声明

struct tag
{
	member-list;
}variable-list;

struct - 结构体关键字
tag - 结构体标签
member-list - 结构体成员
variable-list - 结构体变量

这里结构体的类型是 struct tag,variable-list可以省略。

下面我们来定义一个书的结构类型Book

struct Book
{
	char name[20];
	char author[20];
	float price;
}b1;//全局变量b1

struct Book b2;//全局变量b2
int main()
{
	struct Book b3;//局部变量b3
	return 0;
}

结构体类型的特殊声明

在声明结构的时候,可以不完全的声明,也就是结构体类型没有名字,所以这样的结构体只有在声明的同时创建结构体变量。

struct
{
	int a;
	char b;
	float c
}s1,s2;

我们来看以下代码:

//匿名结构体类型
struct
{
	int a;
	char b;
	float c;
}x;//结构体变量x

struct
{
	int a;
	char b;
	float c;
}a[20], *p;
//结构体数组a,结构体指针p

上面的两个结构在声明的时候省略掉了结构体标签(tag),我们看以下代码是否正确

p = &x;

答案是错误的,编译器会把上面的两个声明当成完全不同的两个类型。 所以是非法的。对于匿名结构体类型,使用要小心。

结构体的自引用

在结构中是否可以包含一个类型为该结构本身的成员呢?

举个例子
数据结构中的链表,每个结点存储数据并且存储了下一个结点的数据,我们定义如下形式的结点的结构体

struct Node
{
	int data;
	struct Node next;
};

这样可不可以?
答案是不行,为什么?
这样定义,struct Node的大小是未知的。
那么该如何定义?

struct Node
{
	int data;
	struct Node* next;
};

我们只需要记住下一个结点的地址即可,因为指针的大小是固定的,所以struct Node的大小是固定的。

我们再来看下面的代码:

typedef struct
{
	int data;
	Node* next;
}Node;
//这样写代码,可行否?

答案是不行,在结构体重命名之前结构体必须存在,此时的结构体是匿名结构体,结构体成员next的类型Node*此时并不存在,所以这样写是错误的。

正确的写法如下:

typedef struct Node
{
	int data;
	struct Node* next;
}Node;

在重命名之前结构体已经有名字Node,所以结构成员next的类型struct Node*已经存在。

结构体变量的定义的和初始化

struct Point
{
	int x;
	int y;
}p1; //声明类型的同时定义变量p1

struct Point p2; //定义结构体变量p2

//初始化:定义变量的同时赋初值。
struct Point p3 = { 1, 2 };

struct Stu //类型声明
{
	char name[15];
	int age; 
};
struct Stu s = { "zhangsan", 20 };//初始化

struct Node
{
	int data;
	struct Point p;
	struct Node* next;
}n1 = { 10, {4,5}, NULL }; //结构体嵌套初始化

struct Node n2 = { 20, {5, 6}, NULL };//结构体嵌套初始化

结构体内存对齐

我们如何计算结构体的大小呢?

这里,首先得掌握结构体的对齐规则:

类型是不占用空间的,只有创建变量才会开辟空间。

1.结构体的第一个成员永远放在与结构体变量偏移量为0的地址处。

2.其他成员变量要对齐到某个数字(对齐数)的整数倍的 偏移地址处。

  这个对齐数 = 编译器默认的对齐数 与 该成员大小的较小值。

3.结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。

4.如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是最大对齐数(含嵌套结构体的对齐数)的整数倍。

//练习1
struct S1
{
	char c1;//1 / 8  对齐数为1
	int i;// 4/8  对齐数为4
	char c2;// 1/8 对齐数为1
};
printf("%d\n", sizeof(struct S1));

c1放在偏移量为0的位置
i的对齐数是4,所以要对齐到偏移量是4的整数倍的位置
c2对齐数是1,对齐到偏移量是1的整数倍的位置
最大对齐数是4,所以结构体大小是4的整数倍

在这里插入图片描述

结果是12。


//练习2
struct S2
{
	char c1;
	char c2;
	int i;
};
printf("%d\n", sizeof(struct S2));

c1的对齐数是1
c2的对齐数是1
i的对齐数是4
最大对齐数是4,结构体大小是4的倍数

在这里插入图片描述

结果是8。

//练习3
struct S3
{
	double d;
	char c;
	int i;
};
printf("%d\n", sizeof(struct S3));

d的对齐数是8
c的对齐数是1
i的对齐数是4
最大对齐数是8,所以结构的大小是8的倍数
在这里插入图片描述

结果是16。

//练习4-结构体嵌套问题
struct S4
{
	char c1;//1/8  1
	struct S3 s3;//最大对齐数是8  
	double d;//8/8   8
};
printf("%d\n", sizeof(struct S4));

c1对齐数是1
s3对齐到自己的最大对齐数(8)的整数倍,这里也就是对齐到8的整数倍
d对齐数是8
结构体的最大对齐数是8,所以结构体的大小是8的整数倍

在这里插入图片描述
结果是32。

为什么要有字节对齐?

大部分的参考资料都是如是说的:

  1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

  2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。比如32位处理器,一次处理4个字节的数据,对于如下结构体类型

struct S
{
	char c;
	int n;
};

如果不存在对齐,在内存中,数据连续存储
在这里插入图片描述
此时如果我们读取数据,先读取4个字节,第一个字节是c,后面3个字节是n的前3个字节数据,然后再读取4个字节,此时才会把n的最后一个字节的数据读取到,所以得到n的数据,需要读取2次

如果是字节对齐的方式存储
在这里插入图片描述
第一次读取4个字节,得到c,3个字节是浪费掉的,第二次读取得到n的,这样只需要一次就得到n。

所以总体来说:
结构体的内存对齐是拿空间来换取时间的做法。

在设计结构体的时候,我们既要满足对齐,又要节省空间,应该怎么做呢?让占用空间小的成员尽量集中在一起

struct S1
{
	char c1;//1/8  1
	int i;//4/8    4
	char c2;//1/8   1
};
//1+3+4+1+3 = 12

在这里插入图片描述
浪费了6个字节空间

再看一下代码

struct S2
{
	char c1;//1/8  1
	char c2;//1/8  1
	int i;//4/8    4
};
//1+1+2+4=8

在这里插入图片描述
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别,S2节省了内存空间。

修改默认对齐数

使用#pragma预处理指令修改默认对齐数

#pragma pack(8)//设置默认对齐数为8
struct S1
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认

#pragma pack(1)//设置默认对齐数为8
struct S2
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认

int main()
{
	//输出的结果是什么?
	printf("%d\n", sizeof(struct S1));//12
	printf("%d\n", sizeof(struct S2));//6
	return 0;
}

结构在对齐方式不合适的时候,我么可以自己更改默认对齐数,默认对齐数一般设置为2的n次方。

宏offsetof

计算结构体的成员相对于首地址的偏移量
offsetof不是函数,是一个宏

size_t offsetof( structName, memberName );
参数structName是类型名

头文件是<stddef.h>

#include <stddef.h>
struct S1
{
	char c1;
	int i;
	char d;
};


int main()
{
	printf("%d\n",offsetof(struct S1,c1));//0
	printf("%d\n",offsetof(struct S1,i));//4
	printf("%d\n",offsetof(struct S1,d));//8
	return 0;
}

结构体传参

在c基础部分,我们已经学习过了结构体传参的内容,我们再来复习一下

struct S
{
	int data[1000];
	int num;
};

//结构体传参
void print1(struct S tmp)
{
	int i = 0;
	for (i = 0; i < 10; i++)
	{
		printf("%d ",tmp.data[i]);
	}
	printf("\nnum = %d\n",tmp.num);
}

//结构体指针传参
void print2(struct S* ps)
{
	int i = 0;
	for (i = 0; i < 10; i++)
	{
		printf("%d ",ps->data[i]);
	}
	printf("\nnum = %d\n",ps->num);
}


int main()
{
	struct S s = { {1,2,3,4,5,6,7,8,9,10},100 };
	print1(s);//值传递
	print2(&s);//址传递
	return 0;
}

函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降。所以为了提升效率,我们传递结构体的地址。
当传递的是结构体指针时,如果我们不允许在函数内部修改结构体的内容,那么形参可以定义成const struct S* ps,这样使用const保护了结构体的成员。

结论: 结构体传参的时候,要传结构体的地址。

位段

结构体实现 位段(位域) 。
位段中的“位”指二进制位。

位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int (整型家族都可以)。
2.位段的成员名后边有一个冒号和一个数字。

struct A
{
	int _a : 2;//2个bit位
	int _b : 5;//5个bit位
	int _c : 10;//10个bit位
	int _d : 30;//30个bit位
};

一共是47个bit位,使用8个字节能存储。
位段可以节省空间。

位段的内存分配

  1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型。
  2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段

下面代码的结果是多少?

struct S
{
	char a:3;
	char b:4;
	char c:5;
	char d:4;
};

int main()
{
	struct S s = {0};
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	return 0;
}

这里,成员变量a占3个bit位,b占4个bit位,c占5个bit位,d占4个bit位,一共是16个bit位,理论上说2个字节正好够用,我们来分析一下,假设一个字节的空间,我们从右向左使用,假设当一个字节剩余的空间不足以放下后面的成员时,我们就重新开辟一个字节,前一个字节剩余的空间就浪费掉,根据我们的假设,画出下图

在这里插入图片描述

s.a = 10;//1010
s.b = 12;//1100
s.c = 3;//0011
s.d = 4;//0100

a占3个bit位,所以发生截断,010存入对应的位置,对于b,c,d也是如此操作

在这里插入图片描述
根据我们的假设,内存中存储的应该是十六进制的ox620304,那么到底是不是呢?我们在VS2019下运行代码测试一下就知道了,运行如下代码:

struct S
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};

int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	printf("%#x\n",*((char*)&s));
	printf("%#x\n",*((char*)&s+1));
	printf("%#x\n",*((char*)&s+2));
	return 0;
}

查看内存,发现内存中存储的数据以及打印的结果和我们设想的一致。在这里插入图片描述
在这里插入图片描述
也就是说,在VS2019集成开发环境下,对于位段的使用,一个字节的空间是从右向左使用,当一个字节剩余空间不足以存放后面的成员时,会舍弃掉剩余的空间,重新开辟空间存放。那么在其他编译器下,对于位段是如何使用的呢?

位段的跨平台问题

  1. int 位段被当成有符号数还是无符号数是不确定的。
  2. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,在16位机器上写成27会出问题。)
  3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
  4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。

所以,不同的编译器下对于位段的使用可能是不一样的,具体的使用情况由编译器来确定。

总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间(优点),但是有跨平台的问题存在(缺点:针对不同的平台写不同的代码)。

位段的应用

  网络中对数据的封装
在这里插入图片描述

枚举

枚举就是一一列举。

把可能的取值一一列举。

比如我们现实生活中:
一周的星期一到星期日是有限的7天,可以一一列举。
性别有:男、女、保密,也可以一一列举。
月份有12个月,也可以一一列举
颜色也可以一一列举。
这里就可以使用枚举来描述。

枚举类型的定义

enum是C语言的关键字,用来定义枚举数据类型,枚举描述的是一组类似于整型数值的集合。

在初阶C语言中,我们学习过,常量有4种,字面常量、const修饰的常变量、#define定义的标识符常量、枚举常量。

枚举类型是预处理指令#define定义常量的替代,枚举和宏其实非常类似,宏在预处理阶段将名字替换成对应的值枚举在编译阶段将名字替换成对应的值,可以将枚举理解为编译阶段的宏。

如何定义枚举类型?

enum TypeName
{
	member1,
	member2,
	...;
};

enum typeName是枚举类型的名字,花括号里面是枚举类型的所有可能取值,叫枚举成员(也叫枚举常量),是常量而不是变量,所以不能对它们赋值,只能将它们的值赋给其他的变量。

我们来看如下定义:

enum Day//星期
{
	Mon,
	Tues,
	Wed,
	Thur,
	Fri,
	Sat,
	Sun
};


在这里插入图片描述

定义枚举变量

有了枚举类型,该如何定义枚举变量呢?

方式一:先定义枚举类型,再定义枚举变量

enum Sex//性别
{
	MALE,
	FEMALE,
	SECRET
};

int main()
{
	enum Sex s;
}

方式二:定义枚举类型的同时定义枚举变量

enum Sex//性别
{
	MALE,
	FEMALE,
	SECRET
}s;

枚举类型的特殊声明

当枚举类型和枚举变量放在一起定义时,枚举类型的名字可以省略不写,类似于匿名结构体声明,此时枚举类型没有名字,那么只能在声明时就定义枚举变量,否则之后再想定义枚举变量就没有办法定义了。

enum//颜色
{
	RED, 
	GREEN,
	BLUE
}c;

枚举的特点

1.默认情况下,枚举常量的值从0开始,依次递增1

enum week
{
	Mon,//0
	Tues,//1
	Wed,//2
	Thur,//3
	Fri,//4
	Sat,//5
	Sun//6
};

int main() 
{
	printf("%d\n",Mon);//0
	printf("%d\n",Tues);//1
	printf("%d\n",Wed);//2
	return 0;
}

2.可以指定枚举常量的值,之后没有指定值的枚举常量,默认递增1

enum Color
{
	RED = 2,
	BLUE,
	GREEN = 5,
	WHITE
};

int main()
{
	printf("%d\n",RED);//2
	printf("%d\n",BLUE);//3
	printf("%d\n",GREEN);//5
	printf("%d\n",WHITE);//6
	return 0;
}

3.枚举常量的值是整数,但是并不是整型,枚举常量是枚举类型。

枚举自身就是一种类型,其中一个枚举常量占的字节数为4个字节,恰好和int类型的变量占的字节数相同,假设把这些枚举常量说明为整型,字符型或其他类型显然是不妥当的,因为枚举类型是一种基本数据类型。枚举成员都是常量,不能对他们进行赋值(可以初始化)。

4.枚举变量的值,只能是枚举常量
枚举常量的类型并不是整型,枚举常量和枚举变量都是枚举类型,所以不能直接将整型值赋值给枚举变量,需要进行强制类型转换。

enum Grade
{
	A,
	B,
	C,
	D,
	E
};

int main()
{
	enum Grade g = (enum Grade)1;
	printf("%d\n",g);
	return 0;
}

5.同一枚举类型中不同的枚举成员可以具有相同的值

enum Sex
{
	MALE,
	FAMLE,
	SECRET = 1
};


int main()
{
	printf("%d\n",FAMLE);//1
	printf("%d\n",SECRET);//1
	return 0;
}

6.同一个程序中不能定义同名的枚举类型,并且不同的枚举类型中也不能存在同名的枚举成员,即只能存在一个同名的枚举常量。

枚举列表中枚举常量的作用范围是全局的,更严格来说是 在main() 函数内部,所以不能再定义与它们名字相同的变量,否则会重定义。

7.枚举类型的数值的范围
枚举常量的大小是4个字节,恰好和int类型的变量占的字节数相同,同时枚举常量的值我们可以理解为是整型常量(并不准确),我们来测试一下

测试上限:

#include <limits.h>
enum Color
{
	RED = INT_MAX,
};


int main()
{
	enum Color c = RED;
	printf("%d %d\n",INT_MAX,c);
	return 0;
}

在这里插入图片描述
在这里插入图片描述
说明枚举类型的最大值是INT_MAX.

测试下限:

#include <limits.h>
enum Color
{
	RED = INT_MIN,
};


int main()
{
	enum Color c = RED;
	printf("%d %d\n",INT_MIN,c);
	return 0;
}

在这里插入图片描述
在这里插入图片描述枚举类型的最小值是INT_MIN.
所以枚举类型的范围是INT_MIN ~ INT_MAX.

枚举的优点

为什么使用枚举?

我们可以使用 #define 定义常量,为什么非要使用枚举?

枚举的优点:
1. 增加代码的可读性和可维护性

2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
#define定义的标识符常量是没有类型的,但是枚举常量属于枚举类型,有类型检查

3. 防止了命名污染(封装)
#define定义的标识符常量是暴露在全局范围内的

4. 便于调试
#define定义的标识符常量在预处理阶段就被完全替换了,所以在调试的时候是查找不到标识符常量的,只有对应的数值。宏在预处理阶段将名字替换成对应的值枚举在编译阶段将名字替换成对应的值,可以将枚举理解为编译阶段的宏。

看如下代码:
在这里插入图片描述
我们调试代码,可以发现,调试时可以查看MON的值,并且MON是week类型
再看如下代码:

在这里插入图片描述
对于#define定义的标识符常量,在调试时我们是查找不到该常量的,因为在预处理阶段已经被数值替换掉了。

枚举常量不占用数据区的内存,而是直接被编译到命令里面,放到代码区,所以不能试图使用&获取它们的地址。

5. 使用方便,一次可以定义多个常量

枚举的使用

void menu()
{
	printf("*****1.add    2.sub****\n");
	printf("*****3.mul    4.div****\n");
	printf("*****0.exit        ****\n");
}

int add(int a,int b)
{
	int c = 0;
	c = a + b;
	return c;
}

int sub(int a,int b)
{
	int c = 0;
	c = a - b;
	return c;
}

int mul(int a, int b)
{
	int c = 0;
	c = a * b;
	return c;
}

int div(int a,int b)
{
	int c = 0;
	c = a / b;
	return c;
}

enum choice
{
	EXIT,
	ADD,
	SUB,
	MUL,
	DIV
};
int main()
{
	int choice = 0;
	do
	{
		menu();
		printf("请选择:>");
		scanf("%d", &choice);
		printf("请输入两个整数:>");
		int a = 0;
		int b = 0;
		int c = 0;
		scanf("%d %d", &a, &b);
		switch (choice)
		{
		case ADD:
			c = add(a, b);
			break;
		case SUB:
			c = sub(a, b);
			break;
		case MUL:
			c = mul(a, b);
			break;
		case DIV:
			c = div(a, b);
			break;
		case EXIT:
			printf("退出!\n");
			break;
		default:
			printf("输入有误!\n");
			break;
		}
		printf("结果为:%d\n",c);
	} while (choice);
	
	return 0;
}

case 关键字后面必须是一个整型常量,或者是整数常量表达式,ADD,SUB,MUL,DIV,EXIT这些枚举常量最终会被替换成一个整数,所以它们可以放在 case 后面。

联合体(共用体)

联合类型的定义

联合也是一种特殊的自定义类型,这种类型定义的变量也包含一系列的成员,特征是这些成员共用同一块空间(所以联合也叫共用体)。

//联合类型的声明
union Un
{
char c;
int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));

结果为4.

union U
{
	char c;
	int i;
};

int main()
{
	union U u = { 1000 };
	//1000 
	//原码:00000000 00000000 00000011 11101000

	printf("%d\n",u.i);
	printf("%d\n",u.c);//-24
	
	//在内存中u.c中存储的是:11101000
	//以%d有符号数打印u.c,需要进行整型提升,因为c的类型是char,是有符号数,
	//整型提升:用符号位进行提升
	//11111111 11111111 11111111 11101000 - 补码
	//10000000 00000000 00000000 00010111 - 反码
	//10000000 00000000 00000000 00011000 - 原码
	//-24

	return 0;
}

假设小端存储
在这里插入图片描述

联合的特点

联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员),联合体的大小 >= 最大成员的大小。

union Un
{
	int i;
	char c;
};
int main()
{
	union Un un;
	// 下面输出的结果是一样的吗?
	printf("%d\n", &(un.i));
	printf("%d\n", &(un.c));
	//下面输出的结果是什么?
	un.i = 0x11223344;
	un.c = 0x55;
	printf("%x\n", un.i);
	return 0;
}

假设小端存储

在这里插入图片描述
&(un.i) = &(un.c)

un.i= 0x11223355

联合的经典例题

判断当前计算机的大小端

使用联合

union U
{
	char c;
	int i;
};

int main()
{
	union U u;
	u.i = 1;
	if (u.c == 1)
	{
		printf("小端存储\n");
	}
	else
	{
		printf("大端存储\n");
	}
	return 0;
}

大小端:一个数据大小大于1个字节,才有大小端之说。

联合大小的计算

1.联合的大小至少是最大成员的大小;
2.当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。

我们来看下面的代码:

union Un1
{
	char c[5];// 1/8  1
	int i;// 4/8   4
};

因为数组c的元素个数是5,所以该数组等价于存放了5个char类型变量,所以对齐数是1,i的对齐数是4,所以联合体的最大对齐数是4,最大成员大小是5,但是5不是4的整数倍,所以联合的大小是8.

union Un2
{
	short c[7];//2/8 2
	int i;//4/8   4
};

数组c相当于7个short类型变量,对齐数是2,i的对齐数是4,联合体的最大成员大小是14,14不是4的整数倍,所以联合体的大小是16

结构体和联合体对比:
1.结构体的成员空间是相互独立的,联合体的成员共用一块空间。

2.对于结构的不同成员赋值相互之间不受影响; 在给联合体的任何一个变量赋值的时候就覆盖了其他的变量,也就是说只有刚赋值的这个变量存在,其他都被覆盖掉了。

3.结构体和联合体都适用于需要把一组变量放在一起考虑的场合。结构体对于描述一个对象的多个属性时比较方便,但是占用内存空间较大;联合体同时只有一个变量存在,占用资源少,但是使用不够方便。

4.结构体、联合体都存在字节对齐。

本章完。

标签:struct,int,char,枚举,联合,printf,对齐,结构
来源: https://blog.csdn.net/weixin_42836316/article/details/120336906