其他分享
首页 > 其他分享> > 爬虫遇到的坑�

爬虫遇到的坑�

作者:互联网

爬取猫眼电影排行,无法正常显示中文,出现乱码

         发现,在爬取百度[https://www.baidu.com/]时出现乱码,通过编码->解码,

import requests
url='https://www.baidu.com/'
html=requests.get(url).text.encode('iso-8859-1').decode('utf-8') 
print(html)

          可以解决乱码问题。但是:不能指定headers,否则还是会出现乱码

正则表达式正确,但却不能正常匹配

 

标签:遇到,电影,爬虫,乱码,报错,出现,猫眼
来源: https://www.cnblogs.com/fran-py-/p/12234588.html