编程语言
首页 > 编程语言> > Python 数据采集的介绍

Python 数据采集的介绍

作者:互联网

Python 数据采集的介绍

1.爬虫是什么

概念:通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程。

2.爬虫的合法性

2.1 风险

2.2 使用

3.介绍

3.1 分类

概述:按照使用场景进行分类

3.2 反爬机制

3.3 robots.txt 协议

君子协议。规定了网站中哪些数据可以被爬虫爬取哪些数据不可以被爬取。

查看网站的协议,直接在相关网站后添加/robots.txt

image-20220630145250090

4.Http与Https

4.1 http与https 协议

概念:就是服务器和客户端进行数据交互的一种形式。

常用请求头信息:

User-Agent:请求载体的身份标识

Connection:请求完毕后,是断开连接还是保持连接

常用响应头信息:

https协议:

- 安全的超文本传输协议

加密方式:

对称秘钥加密
非对称秘钥加密
证书秘钥加密

继续努力,终成大器!

标签:加密,Python,爬虫,介绍,抓取,采集,网站,秘钥,数据
来源: https://www.cnblogs.com/Blogwj123/p/16433384.html