编程语言
首页 > 编程语言> > python爬取页面出现空格符

python爬取页面出现空格符

作者:互联网

读取<th>标签里的文本

header = soup.find('tr')
for th in header:
  print(th.string)

中间会出现多余的换行

在print中加入end=''

print(th.string,end='')

运行结果:

想要将文本存入列表

如果对字符串th.string不做处理,则会将换行符也存入列表内

处理方法为使用split()函数去掉列表中的换行符,再判断列表元素是否为空

for th in header:
if th.string.strip() != '':
title.append(th.string)

运行结果:

换行符已被去除

 

标签:string,python,列表,爬取,header,空格符,th,print,换行符
来源: https://www.cnblogs.com/123-B/p/10881567.html