Python网络爬虫——【1】前期常识
作者:互联网
一、为什么爬?
首先:都说现在是"大数据时代",那数据从何而来?
企业产生的用户数据:百度指数、阿里指数、腾讯浏览指数、新浪微博指数
政府/机构公开的数据:中华人民共和国国家统计局数据、世界银行公开数据、联合国数据、纳斯达克。
数据管理咨询公司:麦肯锡、埃森哲、艾瑞咨询
爬取网络数据:如果需要的数据市场上没有,或者不愿意购买,那么可以选择招/做一名爬虫工程师,自己动手。
二、用什么爬?
大数据时代已经到来,在商业、经济及其他领域中基于数据和分析去发现问题并做出科学、客观的决策越来越重要。在数据分析技术的研究和应用中,爬虫作为数据获取来源之一,扮演着至关重要的角色。
通过学习,我们要学会使用Python在静态网页、动态网页、需要登录后才能访问的网页、PC客户端、APP中爬取数据,并将理论与实践相结合,为将来从事数据爬虫、分析研究工作奠定基础。
1989年,Guido van Rossum(吉多·范罗苏姆)创立了Python语言。
Python崇尚优美、清晰、简单,是一个优秀并广泛使用的语言。
1989年,Guido van Rossum(吉多·范罗苏姆)创立了Python语言。
标签:吉多,网页,Python,常识,爬虫,Guido,数据 来源: https://blog.csdn.net/qq_46009608/article/details/114680253