首页 > 编程语言> > python网络爬虫（四）python第三方库BeautifulSoup4的安装及测试

python网络爬虫（四）python第三方库BeautifulSoup4的安装及测试

2020-03-02 19:03:32 作者：互联网

一、安装

1.以管理员身份启动cmd

2.输入口令：python -m pip install beautifulsoup4 敲回车我在这给大家提个醒，配置环境真的很费时间，中间会出现各种问题，一定不要心急，

心急吃不了热豆腐呀~但是python库安装我认为遇到的问题都是一样的，就是超时，我是一直不断地让它安装，反反复复7/8次，不着急，超时就让它超时，

能安装一点是一点，到最后肯定能安装好~ 给大家上图我不断超时、最后终于成功的截图！

3.在安装成功后，大家可以测试一下是否安装成功。

演示HTML页面地址：http://python123.io/ws/demo.html

可以单击右键鼠标选择查看网页源代码，看不懂不要紧哦，就理解程成是许许多多的标签，构成了页面，一个排版规则

原理就是：我们先用requests库get()方法爬取网页所有内容，然后定义demo为整个文本内容，然后让beautifulsoup（类）来熬制这个汤熬成

它能理解的HTML5。注意哦，我们虽然导入的是beautifulsoup4库，但是我们在写的时候写成了缩写bs4，并且只用一个BeautifulSoup类，

注意B、S是大写

1 import requests
2 r = requests.get("https://python123.io/ws/demo.html")
3 demo = r.text
4 from bs4 import BeautifulSoup
5 soup = BeautifulSoup(demo,"html.parser")  #熬制html类型的解释的汤
6 print(soup.prettify)

这就是今天的第三方库的安装和检测的学习，是不是历程艰辛但是也是很有趣呢~贵在坚持啦

标签：python,demo,爬虫,html,BeautifulSoup4,超时,安装,requests
来源： https://www.cnblogs.com/cutef-ish/p/12312972.html