mysql innodb引擎中varchar和char的区别
作者:互联网
一. 行记录格式
innodb在存储数据的时候是以行的形式存储的,版本相关,并且有固定的格式。可以通过下面的语句查询当前所用版本的行记录格式:
show table status like '表名';
在版本5.6中默认使用格式是Compact,而在8.0中默认的格式是Dynamic。本文描述的是Compact格式下的行记录。版本查询可以使用语句‘select version();’。
Compact格式是5.0引入的,目的是为了高效存储数据。其存储方式如下:
变长字段长度列表 |
NULL标志位 |
记录头信息 |
列1数据 |
列2数据 |
... |
1、变长字段长度列表,注意断句为变长字段-长度-列表。
a) 其描述了行记录中存储内容长度不固定的字段所占用的字节数
b) 按照列的顺序逆序存放
c) 若列的长度小于255个字节,则用一个字节描述
d) 若列的长度大于255个字节,则用两个字节描述
e) 变长字段的长度不能大于65535个字节,所以,最多用两个字节描述其长度:2^16=65536。
2、NULL标志位指示该行数据中是否有null值,有则用1表示,占用1个字节(占用一个字节是书里写的,但是实验下来发现也并非如此,对于书里的内容还是不能全信啊)。
3、记录头信息如下图所示:
4、数据列
5、两个隐藏列:事务ID和回滚指针
a) 事务ID:占用6个字节,描述最新更新该行的事务的ID
b) 回滚指针:占用7个字节,指向undo log链,用于回滚和mvcc
6、没有主键,每行回增加一个6字节的rowid列
现在通过一个表来具体看一下某一行在底层的存储内容,建表语句及插入数据如下所示:
create table mytest( t1 varchar(10), t2 varchar(10), t3 char(10), t4 varchar(10) )engine=innodb charset=latin1 row_format=compact; insert into mytest values ('a', 'bb','bb','ccc'), ('d','ee','ee','fff'), ('d', null, null, 'fff');
通过vscode打开数据表的存储文件mytest.ibd,找到数据记录存储的位置,如下所示:
通过分析其二进制内容,找到第一行记录的位置,分析其内容如下:
03 02 01 /* 变长字段长度列表,逆序 */
00 /* null标志位,第一行没有null值 */
00 00 10 00 2C /* 记录头,固定5字节长度 */
00 00 00 00 02 00 /* RowID,innodb自动创建,6字节 */
00 00 00 00 05 50 /* 事务id */
B7 00 00 01 2B 01 10 /* 回滚指针 */
61 /* 列1数据 'a' */
62 62 /* 列2数据 'bb' */
62 62 20 20 20 20 20 20 20 20 /* 列3数据'bb' */
63 63 63 /* 列4数据 'ccc' */
从上面可以看到,变长字段长度列表是逆序的,char字段未使用的位会用0x20(空格)表示。
第三条记录的二进制表示如下:
03 01 /* 变长字段长度列表,逆序 */
06 /* null标志位,第三行的第二列和第三列为null */
00 00 20 FF 98 /* 记录头,固定5字节长度 */
00 00 00 00 02 02 /* RowID,innodb自动创建,6字节 */
00 00 00 00 05 50 /* 事务id */
B7 00 00 01 2B 01 2C /* 回滚指针 */
64 /* 列1数据 'd' */
66 66 66 /* 列4数据 'fff */
标签:00,01,varchar,字节,char,innodb,变长,20,null 来源: https://www.cnblogs.com/zhangcaiwang/p/14375890.html