首页 > 编程语言> > Python 数据采集的介绍

Python 数据采集的介绍

2022-07-01 09:34:36 作者：互联网

1.爬虫是什么

概念：通过编写程序，模拟浏览器上网，然后让其去互联网上抓取数据的过程。

概述：按照使用场景进行分类

君子协议。规定了网站中哪些数据可以被爬虫爬取哪些数据不可以被爬取。

查看网站的协议，直接在相关网站后添加/robots.txt

概念：就是服务器和客户端进行数据交互的一种形式。

常用请求头信息：

User-Agent：请求载体的身份标识

Connection：请求完毕后，是断开连接还是保持连接

常用响应头信息:

https协议：

- 安全的超文本传输协议

加密方式:

对称秘钥加密
非对称秘钥加密
证书秘钥加密

继续努力，终成大器！

标签：加密,Python,爬虫,介绍,抓取,采集,网站,秘钥,数据
来源： https://www.cnblogs.com/Blogwj123/p/16433384.html