主要原因是因为编码的问题,可能是因为0x80这个字节在gbk编码中没有这个字符,可能原字符是两个字节,在gbk里被解析成了一个字节,导致字符不存在。解决方法有两个,一个是二进制读取,一个是改编编码方式:
with open('article.txt','r',encoding='UTF-8') as f: # 打开新的文本
text_new = f.read() # 读取文本数据
标签:字符,读取,Python,gbk,decode,0x80,文本,字节
来源: https://www.cnblogs.com/GYYer/p/15859556.html