结构体,枚举,联合
作者:互联网
文章目录
本章主要学习C语言中的自定义类型,即结构体、枚举、联合。
结构体
C语言本身具有的内置类型:
char
short
int
long
long long
float
double
但是对于复杂对象,C语言怎么描述?
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
为什么要有结构?
生活中有很多复杂对象,比如我们需要描述一个人,要有姓名、年龄、身高、体重等等,描述一座城市,要有地名、占地面积、旅游景点、特色小吃等等,C语言内置类型并不能满足要求,我们就需要使用自定义类型来描述。
结构体类型声明
struct tag
{
member-list;
}variable-list;
struct - 结构体关键字
tag - 结构体标签
member-list - 结构体成员
variable-list - 结构体变量
这里结构体的类型是 struct tag,variable-list可以省略。
下面我们来定义一个书的结构类型Book
struct Book
{
char name[20];
char author[20];
float price;
}b1;//全局变量b1
struct Book b2;//全局变量b2
int main()
{
struct Book b3;//局部变量b3
return 0;
}
结构体类型的特殊声明
在声明结构的时候,可以不完全的声明,也就是结构体类型没有名字,所以这样的结构体只有在声明的同时创建结构体变量。
struct
{
int a;
char b;
float c
}s1,s2;
我们来看以下代码:
//匿名结构体类型
struct
{
int a;
char b;
float c;
}x;//结构体变量x
struct
{
int a;
char b;
float c;
}a[20], *p;
//结构体数组a,结构体指针p
上面的两个结构在声明的时候省略掉了结构体标签(tag),我们看以下代码是否正确
p = &x;
答案是错误的,编译器会把上面的两个声明当成完全不同的两个类型。 所以是非法的。对于匿名结构体类型,使用要小心。
结构体的自引用
在结构中是否可以包含一个类型为该结构本身的成员呢?
举个例子
数据结构中的链表,每个结点存储数据并且存储了下一个结点的数据,我们定义如下形式的结点的结构体
struct Node
{
int data;
struct Node next;
};
这样可不可以?
答案是不行,为什么?
这样定义,struct Node的大小是未知的。
那么该如何定义?
struct Node
{
int data;
struct Node* next;
};
我们只需要记住下一个结点的地址即可,因为指针的大小是固定的,所以struct Node的大小是固定的。
我们再来看下面的代码:
typedef struct
{
int data;
Node* next;
}Node;
//这样写代码,可行否?
答案是不行,在结构体重命名之前结构体必须存在,此时的结构体是匿名结构体,结构体成员next的类型Node*此时并不存在,所以这样写是错误的。
正确的写法如下:
typedef struct Node
{
int data;
struct Node* next;
}Node;
在重命名之前结构体已经有名字Node,所以结构成员next的类型struct Node*已经存在。
结构体变量的定义的和初始化
struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化:定义变量的同时赋初值。
struct Point p3 = { 1, 2 };
struct Stu //类型声明
{
char name[15];
int age;
};
struct Stu s = { "zhangsan", 20 };//初始化
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = { 10, {4,5}, NULL }; //结构体嵌套初始化
struct Node n2 = { 20, {5, 6}, NULL };//结构体嵌套初始化
结构体内存对齐
我们如何计算结构体的大小呢?
这里,首先得掌握结构体的对齐规则:
类型是不占用空间的,只有创建变量才会开辟空间。
1.结构体的第一个成员永远放在与结构体变量偏移量为0的地址处。
2.其他成员变量要对齐到某个数字(对齐数)的整数倍的 偏移地址处。
这个对齐数 = 编译器默认的对齐数 与 该成员大小的较小值。
- VS中默认的对齐数为8
- Linux没有默认对齐数
3.结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
4.如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是最大对齐数(含嵌套结构体的对齐数)的整数倍。
//练习1
struct S1
{
char c1;//1 / 8 对齐数为1
int i;// 4/8 对齐数为4
char c2;// 1/8 对齐数为1
};
printf("%d\n", sizeof(struct S1));
c1放在偏移量为0的位置
i的对齐数是4,所以要对齐到偏移量是4的整数倍的位置
c2对齐数是1,对齐到偏移量是1的整数倍的位置
最大对齐数是4,所以结构体大小是4的整数倍
结果是12。
//练习2
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S2));
c1的对齐数是1
c2的对齐数是1
i的对齐数是4
最大对齐数是4,结构体大小是4的倍数
结果是8。
//练习3
struct S3
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S3));
d的对齐数是8
c的对齐数是1
i的对齐数是4
最大对齐数是8,所以结构的大小是8的倍数
结果是16。
//练习4-结构体嵌套问题
struct S4
{
char c1;//1/8 1
struct S3 s3;//最大对齐数是8
double d;//8/8 8
};
printf("%d\n", sizeof(struct S4));
c1对齐数是1
s3对齐到自己的最大对齐数(8)的整数倍,这里也就是对齐到8的整数倍
d对齐数是8
结构体的最大对齐数是8,所以结构体的大小是8的整数倍
结果是32。
为什么要有字节对齐?
大部分的参考资料都是如是说的:
-
平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
-
性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。比如32位处理器,一次处理4个字节的数据,对于如下结构体类型
struct S
{
char c;
int n;
};
如果不存在对齐,在内存中,数据连续存储
此时如果我们读取数据,先读取4个字节,第一个字节是c,后面3个字节是n的前3个字节数据,然后再读取4个字节,此时才会把n的最后一个字节的数据读取到,所以得到n的数据,需要读取2次
如果是字节对齐的方式存储
第一次读取4个字节,得到c,3个字节是浪费掉的,第二次读取得到n的,这样只需要一次就得到n。
所以总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
在设计结构体的时候,我们既要满足对齐,又要节省空间,应该怎么做呢?让占用空间小的成员尽量集中在一起
struct S1
{
char c1;//1/8 1
int i;//4/8 4
char c2;//1/8 1
};
//1+3+4+1+3 = 12
浪费了6个字节空间
再看一下代码
struct S2
{
char c1;//1/8 1
char c2;//1/8 1
int i;//4/8 4
};
//1+1+2+4=8
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别,S2节省了内存空间。
修改默认对齐数
使用#pragma预处理指令修改默认对齐数
#pragma pack(8)//设置默认对齐数为8
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为8
struct S2
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
//输出的结果是什么?
printf("%d\n", sizeof(struct S1));//12
printf("%d\n", sizeof(struct S2));//6
return 0;
}
结构在对齐方式不合适的时候,我么可以自己更改默认对齐数,默认对齐数一般设置为2的n次方。
宏offsetof
计算结构体的成员相对于首地址的偏移量
offsetof不是函数,是一个宏
size_t offsetof( structName, memberName );
参数structName是类型名
头文件是<stddef.h>
#include <stddef.h>
struct S1
{
char c1;
int i;
char d;
};
int main()
{
printf("%d\n",offsetof(struct S1,c1));//0
printf("%d\n",offsetof(struct S1,i));//4
printf("%d\n",offsetof(struct S1,d));//8
return 0;
}
结构体传参
在c基础部分,我们已经学习过了结构体传参的内容,我们再来复习一下
struct S
{
int data[1000];
int num;
};
//结构体传参
void print1(struct S tmp)
{
int i = 0;
for (i = 0; i < 10; i++)
{
printf("%d ",tmp.data[i]);
}
printf("\nnum = %d\n",tmp.num);
}
//结构体指针传参
void print2(struct S* ps)
{
int i = 0;
for (i = 0; i < 10; i++)
{
printf("%d ",ps->data[i]);
}
printf("\nnum = %d\n",ps->num);
}
int main()
{
struct S s = { {1,2,3,4,5,6,7,8,9,10},100 };
print1(s);//值传递
print2(&s);//址传递
return 0;
}
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降。所以为了提升效率,我们传递结构体的地址。
当传递的是结构体指针时,如果我们不允许在函数内部修改结构体的内容,那么形参可以定义成const struct S* ps,这样使用const保护了结构体的成员。
结论: 结构体传参的时候,要传结构体的地址。
位段
结构体实现 位段(位域) 。
位段中的“位”指二进制位。
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int (整型家族都可以)。
2.位段的成员名后边有一个冒号和一个数字。
struct A
{
int _a : 2;//2个bit位
int _b : 5;//5个bit位
int _c : 10;//10个bit位
int _d : 30;//30个bit位
};
一共是47个bit位,使用8个字节能存储。
位段可以节省空间。
位段的内存分配
- 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型。
- 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段
下面代码的结果是多少?
struct S
{
char a:3;
char b:4;
char c:5;
char d:4;
};
int main()
{
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
return 0;
}
这里,成员变量a占3个bit位,b占4个bit位,c占5个bit位,d占4个bit位,一共是16个bit位,理论上说2个字节正好够用,我们来分析一下,假设一个字节的空间,我们从右向左使用,假设当一个字节剩余的空间不足以放下后面的成员时,我们就重新开辟一个字节,前一个字节剩余的空间就浪费掉,根据我们的假设,画出下图
s.a = 10;//1010
s.b = 12;//1100
s.c = 3;//0011
s.d = 4;//0100
a占3个bit位,所以发生截断,010存入对应的位置,对于b,c,d也是如此操作
根据我们的假设,内存中存储的应该是十六进制的ox620304,那么到底是不是呢?我们在VS2019下运行代码测试一下就知道了,运行如下代码:
struct S
{
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
int main()
{
struct S s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
printf("%#x\n",*((char*)&s));
printf("%#x\n",*((char*)&s+1));
printf("%#x\n",*((char*)&s+2));
return 0;
}
查看内存,发现内存中存储的数据以及打印的结果和我们设想的一致。
也就是说,在VS2019集成开发环境下,对于位段的使用,一个字节的空间是从右向左使用,当一个字节剩余空间不足以存放后面的成员时,会舍弃掉剩余的空间,重新开辟空间存放。那么在其他编译器下,对于位段是如何使用的呢?
位段的跨平台问题
- int 位段被当成有符号数还是无符号数是不确定的。
- 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,在16位机器上写成27会出问题。)
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
所以,不同的编译器下对于位段的使用可能是不一样的,具体的使用情况由编译器来确定。
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间(优点),但是有跨平台的问题存在(缺点:针对不同的平台写不同的代码)。
位段的应用
网络中对数据的封装
枚举
枚举就是一一列举。
把可能的取值一一列举。
比如我们现实生活中:
一周的星期一到星期日是有限的7天,可以一一列举。
性别有:男、女、保密,也可以一一列举。
月份有12个月,也可以一一列举
颜色也可以一一列举。
这里就可以使用枚举来描述。
枚举类型的定义
enum是C语言的关键字,用来定义枚举数据类型,枚举描述的是一组类似于整型数值的集合。
在初阶C语言中,我们学习过,常量有4种,字面常量、const修饰的常变量、#define定义的标识符常量、枚举常量。
枚举类型是预处理指令#define定义常量的替代,枚举和宏其实非常类似,宏在预处理阶段将名字替换成对应的值,枚举在编译阶段将名字替换成对应的值,可以将枚举理解为编译阶段的宏。
如何定义枚举类型?
enum TypeName
{
member1,
member2,
...;
};
enum typeName是枚举类型的名字,花括号里面是枚举类型的所有可能取值,叫枚举成员(也叫枚举常量),是常量而不是变量,所以不能对它们赋值,只能将它们的值赋给其他的变量。
我们来看如下定义:
enum Day//星期
{
Mon,
Tues,
Wed,
Thur,
Fri,
Sat,
Sun
};
定义枚举变量
有了枚举类型,该如何定义枚举变量呢?
方式一:先定义枚举类型,再定义枚举变量
enum Sex//性别
{
MALE,
FEMALE,
SECRET
};
int main()
{
enum Sex s;
}
方式二:定义枚举类型的同时定义枚举变量
enum Sex//性别
{
MALE,
FEMALE,
SECRET
}s;
枚举类型的特殊声明
当枚举类型和枚举变量放在一起定义时,枚举类型的名字可以省略不写,类似于匿名结构体声明,此时枚举类型没有名字,那么只能在声明时就定义枚举变量,否则之后再想定义枚举变量就没有办法定义了。
enum//颜色
{
RED,
GREEN,
BLUE
}c;
枚举的特点
1.默认情况下,枚举常量的值从0开始,依次递增1
enum week
{
Mon,//0
Tues,//1
Wed,//2
Thur,//3
Fri,//4
Sat,//5
Sun//6
};
int main()
{
printf("%d\n",Mon);//0
printf("%d\n",Tues);//1
printf("%d\n",Wed);//2
return 0;
}
2.可以指定枚举常量的值,之后没有指定值的枚举常量,默认递增1
enum Color
{
RED = 2,
BLUE,
GREEN = 5,
WHITE
};
int main()
{
printf("%d\n",RED);//2
printf("%d\n",BLUE);//3
printf("%d\n",GREEN);//5
printf("%d\n",WHITE);//6
return 0;
}
3.枚举常量的值是整数,但是并不是整型,枚举常量是枚举类型。
枚举自身就是一种类型,其中一个枚举常量占的字节数为4个字节,恰好和int类型的变量占的字节数相同,假设把这些枚举常量说明为整型,字符型或其他类型显然是不妥当的,因为枚举类型是一种基本数据类型。枚举成员都是常量,不能对他们进行赋值(可以初始化)。
4.枚举变量的值,只能是枚举常量
枚举常量的类型并不是整型,枚举常量和枚举变量都是枚举类型,所以不能直接将整型值赋值给枚举变量,需要进行强制类型转换。
enum Grade
{
A,
B,
C,
D,
E
};
int main()
{
enum Grade g = (enum Grade)1;
printf("%d\n",g);
return 0;
}
5.同一枚举类型中不同的枚举成员可以具有相同的值
enum Sex
{
MALE,
FAMLE,
SECRET = 1
};
int main()
{
printf("%d\n",FAMLE);//1
printf("%d\n",SECRET);//1
return 0;
}
6.同一个程序中不能定义同名的枚举类型,并且不同的枚举类型中也不能存在同名的枚举成员,即只能存在一个同名的枚举常量。
枚举列表中枚举常量的作用范围是全局的,更严格来说是 在main() 函数内部,所以不能再定义与它们名字相同的变量,否则会重定义。
7.枚举类型的数值的范围
枚举常量的大小是4个字节,恰好和int类型的变量占的字节数相同,同时枚举常量的值我们可以理解为是整型常量(并不准确),我们来测试一下
测试上限:
#include <limits.h>
enum Color
{
RED = INT_MAX,
};
int main()
{
enum Color c = RED;
printf("%d %d\n",INT_MAX,c);
return 0;
}
说明枚举类型的最大值是INT_MAX.
测试下限:
#include <limits.h>
enum Color
{
RED = INT_MIN,
};
int main()
{
enum Color c = RED;
printf("%d %d\n",INT_MIN,c);
return 0;
}
枚举类型的最小值是INT_MIN.
所以枚举类型的范围是INT_MIN ~ INT_MAX.
枚举的优点
为什么使用枚举?
我们可以使用 #define 定义常量,为什么非要使用枚举?
枚举的优点:
1. 增加代码的可读性和可维护性
2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
#define定义的标识符常量是没有类型的,但是枚举常量属于枚举类型,有类型检查
3. 防止了命名污染(封装)
#define定义的标识符常量是暴露在全局范围内的
4. 便于调试
#define定义的标识符常量在预处理阶段就被完全替换了,所以在调试的时候是查找不到标识符常量的,只有对应的数值。宏在预处理阶段将名字替换成对应的值,枚举在编译阶段将名字替换成对应的值,可以将枚举理解为编译阶段的宏。
看如下代码:
我们调试代码,可以发现,调试时可以查看MON的值,并且MON是week类型
再看如下代码:
对于#define定义的标识符常量,在调试时我们是查找不到该常量的,因为在预处理阶段已经被数值替换掉了。
枚举常量不占用数据区的内存,而是直接被编译到命令里面,放到代码区,所以不能试图使用&获取它们的地址。
5. 使用方便,一次可以定义多个常量
枚举的使用
void menu()
{
printf("*****1.add 2.sub****\n");
printf("*****3.mul 4.div****\n");
printf("*****0.exit ****\n");
}
int add(int a,int b)
{
int c = 0;
c = a + b;
return c;
}
int sub(int a,int b)
{
int c = 0;
c = a - b;
return c;
}
int mul(int a, int b)
{
int c = 0;
c = a * b;
return c;
}
int div(int a,int b)
{
int c = 0;
c = a / b;
return c;
}
enum choice
{
EXIT,
ADD,
SUB,
MUL,
DIV
};
int main()
{
int choice = 0;
do
{
menu();
printf("请选择:>");
scanf("%d", &choice);
printf("请输入两个整数:>");
int a = 0;
int b = 0;
int c = 0;
scanf("%d %d", &a, &b);
switch (choice)
{
case ADD:
c = add(a, b);
break;
case SUB:
c = sub(a, b);
break;
case MUL:
c = mul(a, b);
break;
case DIV:
c = div(a, b);
break;
case EXIT:
printf("退出!\n");
break;
default:
printf("输入有误!\n");
break;
}
printf("结果为:%d\n",c);
} while (choice);
return 0;
}
case 关键字后面必须是一个整型常量,或者是整数常量表达式,ADD,SUB,MUL,DIV,EXIT这些枚举常量最终会被替换成一个整数,所以它们可以放在 case 后面。
联合体(共用体)
联合类型的定义
联合也是一种特殊的自定义类型,这种类型定义的变量也包含一系列的成员,特征是这些成员共用同一块空间(所以联合也叫共用体)。
//联合类型的声明
union Un
{
char c;
int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));
结果为4.
union U
{
char c;
int i;
};
int main()
{
union U u = { 1000 };
//1000
//原码:00000000 00000000 00000011 11101000
printf("%d\n",u.i);
printf("%d\n",u.c);//-24
//在内存中u.c中存储的是:11101000
//以%d有符号数打印u.c,需要进行整型提升,因为c的类型是char,是有符号数,
//整型提升:用符号位进行提升
//11111111 11111111 11111111 11101000 - 补码
//10000000 00000000 00000000 00010111 - 反码
//10000000 00000000 00000000 00011000 - 原码
//-24
return 0;
}
假设小端存储
联合的特点
联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员),联合体的大小 >= 最大成员的大小。
union Un
{
int i;
char c;
};
int main()
{
union Un un;
// 下面输出的结果是一样的吗?
printf("%d\n", &(un.i));
printf("%d\n", &(un.c));
//下面输出的结果是什么?
un.i = 0x11223344;
un.c = 0x55;
printf("%x\n", un.i);
return 0;
}
假设小端存储
&(un.i) = &(un.c)
un.i= 0x11223355
联合的经典例题
判断当前计算机的大小端
使用联合
union U
{
char c;
int i;
};
int main()
{
union U u;
u.i = 1;
if (u.c == 1)
{
printf("小端存储\n");
}
else
{
printf("大端存储\n");
}
return 0;
}
大小端:一个数据大小大于1个字节,才有大小端之说。
联合大小的计算
1.联合的大小至少是最大成员的大小;
2.当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
我们来看下面的代码:
union Un1
{
char c[5];// 1/8 1
int i;// 4/8 4
};
因为数组c的元素个数是5,所以该数组等价于存放了5个char类型变量,所以对齐数是1,i的对齐数是4,所以联合体的最大对齐数是4,最大成员大小是5,但是5不是4的整数倍,所以联合的大小是8.
union Un2
{
short c[7];//2/8 2
int i;//4/8 4
};
数组c相当于7个short类型变量,对齐数是2,i的对齐数是4,联合体的最大成员大小是14,14不是4的整数倍,所以联合体的大小是16
结构体和联合体对比:
1.结构体的成员空间是相互独立的,联合体的成员共用一块空间。
2.对于结构的不同成员赋值相互之间不受影响; 在给联合体的任何一个变量赋值的时候就覆盖了其他的变量,也就是说只有刚赋值的这个变量存在,其他都被覆盖掉了。
3.结构体和联合体都适用于需要把一组变量放在一起考虑的场合。结构体对于描述一个对象的多个属性时比较方便,但是占用内存空间较大;联合体同时只有一个变量存在,占用资源少,但是使用不够方便。
4.结构体、联合体都存在字节对齐。
本章完。
标签:struct,int,char,枚举,联合,printf,对齐,结构 来源: https://blog.csdn.net/weixin_42836316/article/details/120336906