其他分享
首页 > 其他分享> > 有粉丝问怎么爬App,我手把手教了他(多图警告)

有粉丝问怎么爬App,我手把手教了他(多图警告)

作者:互联网

前言

最近看见很多读者在说怎么抓取APP上的内容

APP的爬取自然是要比网页要麻烦。但是只要我们把前期的工作做好,后面也会更加的顺利。

今天这篇文章就是来教大家如何抓取到APP数据,用什么软件,怎么配置?

Charles

在这里插入图片描述

首先,我们来看看百度百科是怎么介绍这款软件的

是一个HTTP代理服务器,HTTP监视器,反转代理服务器,当浏览器连接Charles的代理访问互联网时,Charles可以监控浏览器发送和接收的所有数据。它允许一个开发者查看所有连接互联网的HTTP通信,这些包括request,
response和HTTP headers (包含cookies与caching信息)。

其实简单理解就是一个抓包软件,这个大家可能少见,但是fiddler和wireshack大家应该是有所耳闻。其实功能差不多类似。

为什么推荐这款呢?

其实不管是app抓包还是pc端的抓包也有其他的一些软件,但是charles它既有win版、macos版也有linux版。

所以它兼容的平台是很多的。

废话不多说了,我们直接开整(此处使用macos系统演示,其他系统类似)。

准备工作:一台电脑、一部手机、一个wifi

第一步当然是把软件下载好,这里不多说,尽量去搜pj版,因为charles是需要付费,但是也会有30天的试用期。

下面我们打开软件charles,找到菜单栏Proxy->Proxy Settings

在这里插入图片描述
这里我们设置成8888端口,默认就是8888的不需要再次设置了。

在这里插入图片描述
之后,我们再进入Proxy->SSL Proxying Settings

在这里插入图片描述

添加一个地址为 * ,端口为443

在这里插入图片描述

安装证书

在这里插入图片描述

安装完成之后,我们可以看到如下证书

在这里插入图片描述

这说明我们的证书安装完成。

接下来,我们还要继续安装一个证书。

在这里插入图片描述

点击之后,它会弹出如下弹窗

在这里插入图片描述

大体的意思就是让我们去把手机的wifi中代理改了。

这里其实很简单,我们进入手机的设置,然后点击wifi后面的感叹号就能进行设置(手机有差异,自行琢磨)

在这里插入图片描述
进入手动配置代理,这里的服务器填写你电脑的ip(macos使用ifconfig,windows使用ipconfig可以查看),在前面的提示窗口中,我们也能够看到ip地址。

端口号填写我们之前设置的8888

在这里插入图片描述

点击存储,然后我们使用浏览器去访问chls.pro/ssl

如果此时访问没反应,可以看下电脑,会有一个弹窗,点击Allow即可。

在这里插入图片描述
这里我们点击允许

然后回到设置,我们就可以看到安装描述文件的提示了

在这里插入图片描述

我们这里点击安装就可以了。

在这里插入图片描述
最后,我们来简单测试一下,我们打开小红书app,然后可以观察到charles已经开始抓取了。

在这里插入图片描述

这就说明了,我们成功进行配置了。

这是我们想要进行app或者小程序抓取的第一步,如果这一步没做好,后面的工作根本无法进行。

总结

一旦成功抓包,传统网页爬虫的技术大部分都能用上了,因为大部分App也是使用的HTTP协议传输数据的。取决于App的设计,App的抓取可能需要解决安卓逆向等独特难点。

关于Python技术储备

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

二、学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

三、入门学习视频

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

五、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。


这份完整版的Python全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

标签:点击,HTTP,Python,手把手,App,抓取,学习,多图,我们
来源: https://blog.csdn.net/Yuki1127918/article/details/122759610