分布式爬虫的框架小编也为大家介绍了不少,除了三种常见的,还有我们熟悉的scrapy框架。对于大部分小伙伴而言,掌握前四种已经可以满足大部分的使用需求了。不过小编一直在想有没有一种框架,可以弥补其他框架中的不足,在使用功能上更加强大呢?经过一番资料的搜集,发现了Gerapy 这个框架。很多人可能没太接触过,下面小编就跟大家详细讲解python分布式爬虫中的Gerapy及安装方法。
Gerapy 是一款分布式爬虫管理框架,支持 Python 3,基于 Scrapy、Scrapyd、Scrapyd-Client、Scrapy-Redis、Scrapyd-API、Scrapy-Splash、Jinjia2、Django、Vue.js 开发,Gerapy 可以帮助我们:
- 更方便地控制爬虫运行
- 更直观地查看爬虫状态
- 更实时地查看爬取结果
- 更简单地实现项目部署
- 更统一地实现主机管理
- 更轻松地编写爬虫代码
安装非常简单,只需要运行 pip3 命令即可:
$ pip3 install gerapy
安装完成之后我们就可以使用 gerapy 命令了,输入 gerapy 便可以获取它的基本使用方法:
$ gerapy Usage: gerapy init [--folder=<folder>] gerapy migrate gerapy createsuperuser gerapy runserver [<host:port>] gerapy makemigrations
如果出现上述结果,就证明 Gerapy 安装成功了。
这里小编要跟大家透露的是,Gerapy框架较于scrapy来说操作流程更加简便,在代码方面是可以生成的。看到这里,还没有下载安装Gerapy的小伙伴赶紧行动吧。
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试