奇葩报错

2021-09-06 08:33:07 作者：互联网

from pyquery import PyQuery as pq
html = '''
<div id="panel">
    <ul class="list1">
        <li class="item1" value1="1234" value2 = "hello world"><a href="https://geekori.com"> geekori.com</a></li>
        <li class="item"><a href="https://www.jd.com"> 京东商城</a></li>        
    </ul>
    <ul class="list2">
        <li class="item3"><a href="https://www.taobao.com">淘宝</a></li>
        <li class="item" ><a href="https://www.microsoft.com">微软</a></li>
        <li class="item2"><a href="https://www.google.com">谷歌</a></li>
    </ul>
</div>

'''
# 创建PyQuery对象
doc = pq(html)
# 提取id属性值为panel,并在该节点中所有属性值为list1的所有节点
result = doc('#panel .list1')
# 输出result的类型，但仍然是PyQuery对象
print(type(result))
print(result)
# 在result为根的基础上，提取其中class属性值为item的所有节点
print(result('.item'))
# 提取其中的第2个a节点的href属性值和文本内容
print(result('a')[1].get('href'),result('a')[1].text)
print()
# 抓取京东商城导航条链接文本
import requests
# 请求京东商城首页，并将返回的HTML代码传入pq对象
doc = pq(requests.get('https://www.jd.com').text
# 提取第一个ul节点
group1 = doc('#navitems-group1') # 我电脑编码有问题吧，这group1原理没有报错，扯蛋的vscode
# 提取出前四个链接的文本
print(group1('a')[0].text,group1('a')[1].text,group1('a')[2].text,group1('a')[3].text)
group2 = doc('#navitems-group2')
print(group2('a')[0].text,group2('a')[1].text,group2('a')[2].text,group2('a')[3].text)

group3 = doc('#navitems-group3')
print(group3('a')[0].text,group3('a')[1].text)

我啥也没改，就是在注释的时候不小心加了个"）"难道是触发了不可抗力，给我报错了，真的服了，我要真正的学习下怎么调试出错误

标签：text,doc,group1,result,group2,print,报错,奇葩
来源： https://www.cnblogs.com/wkhzwmr/p/15232193.html