爬虫的概述

834次阅读
没有评论
爬虫的概述

1.爬虫是什么呢?

爬虫是指按照一定的规则,自动地抓取网络数据,再对数据进行解析复用的程序或者脚本。

2.爬虫的分类

网络爬虫按照系统结构和实现技术,大致可以分为以下几种类型:通用网络爬虫(General Purpose Web Crawler)、聚焦网络爬虫(Focused Web Crawler)、增量式网络爬虫(Incremental Web Crawler)、深层网络爬虫(Deep Web Crawler)。 实际的网络爬虫系统通常是几种爬虫技术相结合实现的。

3.爬虫的应用场景

也就是说你为什么要写这个爬虫程序或者脚本呢?是为了好玩还是用来装酷呢?

本质就是你拿到数据要干嘛呢,

  • 3.1你可以进行热门岗位分析比如可以爬取拉勾网python工作职位的薪资以及待遇情况。
  • 3.2也可以拿到豆瓣电影(豆瓣图书)的top100的电影名字、演员、上映时间以及各大网友的评论。
  • 3.3你也可以做一个软件,可以通过爬取各个商店的同一类产品的数据,来比较他们的价格,销量,好评度等等,让你的朋友们永远你的软件,可以带来更多的乐趣吧。
  • 3.4你也可以做一个信息咨询汇集的网页,也就是搜索引擎
  • 3.5当然数据分析的前提是需要很多数据的,可以通过爬虫爬取下来。
  • 3.6股市预测
  • 3.7刷票抢票短信电话轰炸等等

应用还是非常多的,当我们熟练爬虫之后就可以实现我们的一些有趣的想法。

 

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

相关文章:

版权声明:Python教程2022-10-24发表,共计563字。
新手QQ群:570568346,欢迎进群讨论 Python51学习