微博 新老入口
作者:互联网
https://weibo.cn
https://weibo.cn/search/mblog?advanced=mblog&f=s
微博抓取经验总结
-
微博不封IP,只封账号
- 对于weibo.cn和weibo.com这两个站点的cookie是不同的,所以要构建两个账号池,一个cn站点的,一个com站点的。
总结
- 解决微博登陆问题,并构建账号池
- 通过scrapy-redis框架构建分布式系统
- 深入分析微博高级搜索需求的解决方案,并编写weibo.cn和weibo.com两个站点的爬虫
标签:weibo,cn,入口,站点,微博,新老,https,com 来源: https://www.cnblogs.com/du-jun/p/12188870.html