其他分享
首页 > 其他分享> > 论文爬取 pdf文件爬取(一)

论文爬取 pdf文件爬取(一)

作者:互联网

方法的选择

在论文的爬取中

对于整个的网页内容的一个爬取

这个网页是一个内容比较多的一个网页

所以我选择了selenium中的webdriver库

来进行网页的解析然后进行爬取

def gethtml(url):
brower = webdriver.Firefox()
brower.get(url)
html = brower.page_source
return html

标签:webdriver,网页,url,论文,爬取,html,brower,pdf
来源: https://www.cnblogs.com/huangmouren233/p/14842887.html