首页 > 其他分享> > 每日日报2021.5.20

每日日报2021.5.20

2021-06-21 14:32:35 作者：互联网

今天完成内容：

学习web

cvpr论文查询热词分析

1。论文爬取成功

from bs4 import BeautifulSoup
import requests
import re
import pymysql
conn=pymysql.connect(host="localhost",
                     user='root',
                     password='123456',
                     port=3306,
                     db='e_manager',
                     )
# 建立游标
cursor=conn.cursor()
sql="select * from students"
result_DB=cursor.execute(sql)
print(result_DB)
if(result_DB):
    print("连接成功")

url="https://blog.csdn.net/u014636245/article/details/91426736"
# 设置headers
headers={

    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100101 Firefox/89.0"
}
res=requests.get(url,headers=headers)
# 页面源码
page_content=res.text
obj=re.compile(r'<td>.*?<a href="(?P<link>.*?)">(?P<name>.*?)</a>',re.S)
# 开始匹配
result=obj.finditer(page_content)
i=1

for it in result:

    print(it.group("link"))
    # 论文链接
    link=it.group("link")
    print(it.group("name"))
    #论文名字
    name=it.group("name")
    # 论文编号
    id=i

    i=i+1
    sql_insert=("INSERT INTO words(id,name,link)" "VALUES(%s,%s,%s)")
    # 建立元组
    data=(id,name,link)
    cursor.execute(sql_insert,data)
    conn.commit()
    print("完成第")
    print(id)
    print("条数据插入")
# res.encoding="utf-8"
# html=res.text
# soup=BeautifulSoup(html)
# soup.find("h2").text
# soup.find("a")

看视频

遇到问题：

无

明日目标：

学习web端的开发

学习css

标签：2021.5,name,日报,group,cursor,link,result,print,20
来源： https://www.cnblogs.com/leiyu1905/p/14913194.html