python爬取页面出现空格符
作者:互联网
读取<th>标签里的文本
header = soup.find('tr')
for th in header:
print(th.string)
中间会出现多余的换行
在print中加入end=''
print(th.string,end='')
运行结果:
想要将文本存入列表
如果对字符串th.string不做处理,则会将换行符也存入列表内
处理方法为使用split()函数去掉列表中的换行符,再判断列表元素是否为空
for th in header:
if th.string.strip() != '':
title.append(th.string)
运行结果:
换行符已被去除
标签:string,python,列表,爬取,header,空格符,th,print,换行符 来源: https://www.cnblogs.com/123-B/p/10881567.html