期末将近,python也要结课了,老师要求我们写一个关于爬虫的程序作为大作业
单纯的爬虫自然没有意思,那我们肯定需要将爬取到的数据进行展示以及分析处理
由于自己自学了数据库方面的内容,所以也尝试着将数据库结合到该程序中
于是就诞生了这样一个类似音乐播放器的应用程序
以下为每一部分内容的对应博客地址:
Python大作业——爬虫+可视化+数据分析+数据库(爬虫篇)
Python大作业——爬虫+可视化+数据分析+数据库(可视化篇)
Python大作业——爬虫+可视化+数据分析+数据库(数据分析篇)
Python大作业——爬虫+可视化+数据分析+数据库(数据库篇)
爬虫
由于想要实现一个音乐播放软件,以前学习前端时也实现过网页的播放器,不过那个时候的搜索功能是使用他人封装好的API接口直接调用数据。那时候就在想着以后也想自己写一个,于是便借此机会使用爬虫实现自己爬取并封装数据。
爬取的网站如下
https://www.8lrc.com
http://m.yue365.com
https://www.9ku.com
主要实现以下功能:
- 通过歌手姓名,歌曲名字作为关键字爬取歌曲并实现在线播放
- 爬取当前热门歌曲
- 爬取热门歌手的歌曲
可视化
使用pyqt进行界面设计
主要分为登录注册界面以及主界面
大概界面展示如下:
数据分析
打算对爬取到的热门歌曲的歌手进行分析,使用柱状图展示拥有热门歌曲数量前十的歌手
将拥有热门歌曲数量前20名的歌手与热门歌手前20名进行相关性分析
对热门歌曲名进行热点分析
以上由于时间问题暂时搁置咳咳
对热门歌手拥有歌曲量的占比生成饼图
对歌曲的热度进行分析,生成柱状图
对搜索到的结果的歌词生成词云
数据库
使用mysql+SQLyog+pymsql
主要实现注册登录功能以及收藏下载功能
用户登录后可以进行歌曲的收藏并且可以查看自己所收藏和下载的歌曲信息
写在最后
程序目前已经基本开发完成,可以前往我主页中的“资源”处进行下载,同时我也将项目在gitee和github上开源,点击前往我的gitee,点击前往我的github,期待大家的Star或Fork,欢迎大家一起交流学习
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试