首页 > TAG信息列表 > xbd
一 纯净模板机的安装
1. 最小化安装 (1) 打开VMware,点击左上角文件,新建虚拟机 (2) 选择自定义(高级),下一步,下一步 (3) 选择稍后安装操作系统(S),下一步 (4) 选择Linux(L),版本为CentO S7 64 位,下一步 (5) 虚拟机名称为base,选择磁盘位置,下一步 (6) 设置处理器数量为2,每个处理器的内核数量为6,关于\x开头的字符串编码转换中文解决方法
做爬虫可能经常遇到爬取到的数据存在编码问题,简直让人头疼,比如爬取到的是这样的: 例如: \xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c 中文是: 你好世界 上面这个是utf-8编码,但数据类型是字符串类型,而不是bytes类型的utf-8编码。 这样会导致一个结果:如果直接输出,显示的二次编码
二次编码 编码回顾 ascii : 英文,数字,符号 英文: 1个字节,8位 gbk : 英文,数字,符号,中文 英文: 1个字节,8位 中文: 2个字节,16位 unicode : 英文,数字,符号,中文 英文: 4个字节,32位 中文: 4个字节,32位 utf-8 : 英文,数字,符号,中文 英文: 1个字python字符串
字符串内置函数 ord('A') 65 chr(88) 'X' s1 = 'ABCD' s1.encode('ASCII') b'ABCD' s2 = '你好啊' s2.encode('UTF-8') b'\xe4\xbd\xa0\xe5\xa5\xbd\xe5\x95\x8a' s2.encode('UTF-16