这本Python社会媒体挖掘图书,是2018-10-01月由人民邮电出版社所出版的,著作者信息: [意] 马尔科·邦扎尼尼(Marco Bonzanini) 著,陈小莉,陶俊杰 译,本版是第1次印刷, ISBN:9787115494016,品牌:人民邮电出版社, 这本书的包装是16开平装,所用纸张为胶版纸,全书页数229,字数有万字, 是本值得推荐的Python软件开发图书。
此书内容摘要
本书共分为9章,从社会媒体API、数据挖掘技巧和Python的数据工具这3个主题进行阐释。主要内容包括:如何用Python通过公共API与社会媒体平台交互,如何以方便的格式为数据分析存储社会媒体数据,如何使用Python数据工具分割社会媒体数据,如何用文本分析方法理解社会媒体数据,如何用先进的统计和分析手段从海量数据中挖掘出有用信息,以及如何用Web技术来可视化数据。
关于此书作者
马尔科·邦扎尼尼(Marco Bonzanini) 数据咨询师,拥有伦敦玛丽王后大学信息检索专业博士学位,是PyData伦敦meetup及系列会议的合作组织者,在很多国际会议上做过演讲,并且在PacktPub上教授“Python数据分析”和“实用Python数据技术”两门课程。他在个人博上分享了很多技术主题,主要关于Python、文本分析和数据。
编辑们的推荐
Python是非常适合数据家在中小型数据集上建造原型、可视化和分析数据的编程语言。本书将帮助你获取和分析来自各大社会媒体网站的数据,展示如何使用的Python工具来挖掘Stack Exchange等流行社交网站。
※ 通过公共API与社会媒体平台进行交互
※ 以方便的格式存储社交数据以进行分析
※ 使用Python数据工具对社交数据进行切片和分段
※ 应用文本分析技术来理解人们在社会媒体上谈论的内容
※ 运用先进的统计和分析技术从数据中发现有用的见解
※ 采用Web技术进行可视化,以探索数据和呈现数据产品
Python社会媒体挖掘图书的目录
第 1章社会媒体、社交数据和Python1
1.1入门1
1.2社会媒体——机遇和挑战2
1.2.1机遇3
1.2.2挑战4
1.2.3社会媒体挖掘技术7
1.3Python的数据工具10
1.3.1Python开发环境的安装11
1.3.2高效的数据分析14
1.3.3机器学习17
1.3.4自然语言处理21
1.3.5社会网络分析25
1.3.6数据可视化26
1.4Python中的数据处理28
1.5创建复杂的数据管道29
1.6小结30
第2章 Twitter数据挖掘——标签、话题和时间序列31
2.1入门31
2.2Twitter API32
2.2.1接口访问频率限制32
2.2.2搜索与流33
2.3从Twitter收集数据34
2.3.1从时间线获取推文35
2.3.2推文的结构38
2.3.3使用流API42
2.4分析推文——实体分析44
2.5分析推文——文本分析48
2.6分析推文——时间序列分析54
2.7小结57
第3章Twitter用户、粉丝和社区58
3.1用户、好友和粉丝58
3.1.1回到Twitter API58
3.1.2用户资料的结构59
3.1.3下载好友和粉丝的资料62
3.1.4分析你的社会网络64
3.1.5度量影响力和参与度68
3.2挖掘粉丝72
3.3挖掘对话77
3.4在地图上绘制推文80
3.4.1将推文转换为GeoJSON80
3.4.2用Folium轻松绘制地图83
3.5小结89
第4章Facebook帖子、页面和用户互动90
4.1Facebook Graph API90
4.1.1注册你的应用90
4.1.2鉴权和安全92
4.1.3用Python连接Facebook Graph API93
4.2挖掘你的帖子96
4.2.1帖子的结构99
4.2.2时间频率分析99
4.3挖掘Facebook页面101
4.3.1从页面获取帖子103
4.3.2度量参与度107
4.3.3用词云可视化帖子112
4.4小结114
第5章Google+话题分析115
5.1Google+ API入门115
5.2在Web GUI中嵌入搜索结果120
5.2.1Python的装饰器121
5.2.2Flask路由和模板122
5.3Google+页面的笔记和活动125
5.4笔记的文本分析和TF-IDF计算127
5.5小结134
第6章Stack Exchange提问和回答135
6.1提问和回答135
6.2Stack Exchange API入门137
6.2.1搜索带标签的问题139
6.2.2搜索用户142
6.3处理Stack Exchange的存档数据144
6.4问题标签的文本分类149
6.4.1监督学习和文本分类149
6.4.2分类算法153
6.4.3评估155
6.4.4Stack Exchange数据的文本分类157
6.4.5在实时应用中嵌入分类器161
6.5小结165
第7章博客、RSS、维基百科和自然语言处理166
7.1博客和自然语言处理166
7.2从博客和网站获取数据166
7.2.1使用WordPress.com API167
7.2.2使用Blogger API170
7.2.3解析RSS和Atom订阅173
7.2.4从维基百科获取数据174
7.2.5关于网络爬取的一点建议176
7.3自然语言处理基础177
7.3.1文本处理177
7.3.2信息抽取185
7.4小结190
第8章挖掘所有数据191
8.1很多社交API191
8.2挖掘YouTube上的视频191
8.3挖掘GitHub上的开源软件196
8.4挖掘Yelp上的本地商家203
8.5创建自定义的Python客户端208
8.6小结210
第9章关联数据和语义网211
9.1数据网211
9.1.1语义网词汇212
9.1.2微格式215
9.1.3关联数据和开放数据216
9.1.4RDF217
9.1.5JSON-LD格式218
9.1.6Schema.org219
9.2从DBpedia挖掘关系220
9.3挖掘地理坐标222
9.3.1从维基百科抽取地理数据222
9.3.2在Google Maps上绘制地理数据225
9.4小结229
部分内容试读
暂无.
关于此书评价
暂无.
书摘内容
暂无.
Python社会媒体挖掘最新最全的试读、书评、目录、简介信息由Python中文网整理提供。
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试