首页 > 编程语言> > python中的编解码

python中的编解码

2022-05-25 11:00:15 作者：互联网

python中的编解码实在麻烦，经常解码报错，因此来梳理一下

unicode、utf-8、ascii码、b''、\u、\x 这些经常用的，之间的转换及含义

unicode、utf-8、ascii是编码类型，由于计算机只识别0和1，所以自然界的问题，在计算机中处理，需要编码成这些类型。

ascii码是最开始的，美国人用的包含26个字母及其他的一些符号的，只有1个字节。

unicode是包含了其他国家，例如中文，韩文，日文等的一些，通常有2个字节，有些有4个字节。

utf-8是本着节约的精神，在unicode8的基础上做优化的，兼容ascii码。

\u表示unicode编码

\x为16进制

b''为python中的byte表示，一般用于网络传输

三者的关系，可以通过下图观察。

所以b''流用于在网络中传输，都是单个字节的，收端使用相应的编码进行解码。

虽然这里看起来差不多，但是本质上是不同的，b''中包含的其实本质上都是16进制的字节用\x表示，这里只是为了方便用户展示（ps：我个人觉得还不如不展示，容易使人迷惑），ascii码的可表达的都会进行这种展示，中文的还是会用\x这种表达。

\u4e2d\u6587 和中文其实都是字符串，都是unicode的表达形式。

标签：编解码,utf,字节,编码,python,unicode,ascii
来源： https://www.cnblogs.com/lynalee/p/16308536.html