奇葩报错
作者:互联网
from pyquery import PyQuery as pq
html = '''
<div id="panel">
<ul class="list1">
<li class="item1" value1="1234" value2 = "hello world"><a href="https://geekori.com"> geekori.com</a></li>
<li class="item"><a href="https://www.jd.com"> 京东商城</a></li>
</ul>
<ul class="list2">
<li class="item3"><a href="https://www.taobao.com">淘宝</a></li>
<li class="item" ><a href="https://www.microsoft.com">微软</a></li>
<li class="item2"><a href="https://www.google.com">谷歌</a></li>
</ul>
</div>
'''
# 创建PyQuery对象
doc = pq(html)
# 提取id属性值为panel,并在该节点中所有属性值为list1的所有节点
result = doc('#panel .list1')
# 输出result的类型,但仍然是PyQuery对象
print(type(result))
print(result)
# 在result为根的基础上,提取其中class属性值为item的所有节点
print(result('.item'))
# 提取其中的第2个a节点的href属性值和文本内容
print(result('a')[1].get('href'),result('a')[1].text)
print()
# 抓取京东商城导航条链接文本
import requests
# 请求京东商城首页,并将返回的HTML代码传入pq对象
doc = pq(requests.get('https://www.jd.com').text
# 提取第一个ul节点
group1 = doc('#navitems-group1') # 我电脑编码有问题吧,这group1原理没有报错,扯蛋的vscode
# 提取出前四个链接的文本
print(group1('a')[0].text,group1('a')[1].text,group1('a')[2].text,group1('a')[3].text)
group2 = doc('#navitems-group2')
print(group2('a')[0].text,group2('a')[1].text,group2('a')[2].text,group2('a')[3].text)
group3 = doc('#navitems-group3')
print(group3('a')[0].text,group3('a')[1].text)
我啥也没改,就是在注释的时候不小心加了个")"难道是触发了不可抗力,给我报错了,真的服了,我要真正的学习下怎么调试出错误
标签:text,doc,group1,result,group2,print,报错,奇葩 来源: https://www.cnblogs.com/wkhzwmr/p/15232193.html