项目github地址:https://github.com/kocor01/scrapy_cloud
Python版本为3.6
自己写的简单架构《python爬虫,爬取豆瓣电影《芳华》电影短评,分词生成词云图。》
这个是用Scrapy框架重新实现的
爬虫爬取最近比较火的电影《芳华》分词后生成词云图
使用了 jieba分词,云图用wordcloud生成
用了朋友的2B姿势的自拍照片简单的P了下(为了不暴露,P成全黑的),作为生成词云图的底图模板
在生成词云图的过程中,发现一个问题,词云图底图模板有PNG格式的图片生成出来的效果很差,例如用下图PNG格式去生成,生成出来的词语图根本不成人形。本例是用JPG格式的图片去生成,生成出来的效果还是相当不错的。建议底图用JPG去生成。其他格式的图片没试验,不知生成的效果如何。
词云图底图模板:
生成词云图效果:
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试