其他分享
首页 > 其他分享> > 厂家批发市场

厂家批发市场

作者:互联网

从一开始,网站就被用来分享信息。无论是维基百科的文章,YouTube频道,Instagram账号,还是Twitter账号。它们都充满了有趣的数据,每个人只要能访问互联网和web浏览器就可以获得这些数据。

但是,如果我们想通过编程获得任何特定的数据呢?

有两种方法可以做到:-

使用官方API

网页抓取

引入了API(应用程序编程接口)的概念,以标准的方式在不同的系统之间交换数据。但是,大多数时候,网站所有者不提供任何API。在这种情况下,我们只剩下使用web抓取来提取数据的可能性。

基本上,每个web页面都以HTML格式从服务器返回。这意味着我们实际的数据被很好地打包在HTML元素中。它使得检索特定数据的整个过程非常简单和直接。

本教程将是您学习使用Python编程语言进行web抓取的最终指南。首先,我将向您介绍一些基本示例,以使您熟悉web抓取。稍后,我们将使用这些知识从Livescore中提取。

废话不多说,让我们跟着我走吧。

开始

为了让我们开始,你需要启动一个新的Python3项目,并安装Scrapy(一个用于Python的web抓取和web爬行库)。我在本教程中使用pipenv,但是你可以使用pip和venv,或者conda。

pipenv install scrapy

在这一点上,您有了Scrapy,但是您仍然需要创建一个新的web抓取项目,并且Scrapy为我们提供了一个命令行来完成这项工作。

现在让我们使用scrapy cli创建一个名为web_scraper的新项目。

如果你像我一样使用pipenv,请使用:

pipenv run scrapy startproject web_scraper .

标签:web,pipenv,抓取,厂家,使用,批发市场,Scrapy,scrapy
来源: https://blog.csdn.net/m0_54127431/article/details/112056789